百度诉奇虎360违反“Robots协议”抓取、复制其网站内容侵权一案,10月16日上午在北京市第一中级人民法院开庭审理。百度方面认为,360搜索在未获得百度公司允许的情况下,违反业内公认的Robots协议,抓取百度旗下百度知道、百度百科、百度贴吧等网站的内容,已经构成了不正当竞争,并向奇虎索赔1亿元。
百度公关部郭彪向媒体表示,Robots协议是网站信息和网民隐私保护的国际通行规范之一,理应得到全球互联网公司的共同遵守。不尊重Robots协议将可能导致网民隐私大规模泄露。此前,360服务器抓取网民隐私存在自己的服务器上,因自身网站的漏洞被谷歌搜索抓取,导致奇瑞汽车内部采购文件、三峡集团财务报表等商业秘密,以及140万网民隐私被泄露和传播。违反Robots协议再次暴露了360无视网站版权和网民隐私的一贯思维。奇虎360也因此遭到国家版权局、国家工商总局等权威部门严厉批评。
郭彪表示,奇虎360最为恶劣的,并非是其搜索爬虫故意违反Robots协议的做法,而是它利用360浏览器等客户端,强行抓取网民的浏览数据和信息到搜索服务器,完全无视Robots协议。这一做法目前已经导致大量企业内网信息被泄露。去年底,百度工程师通过一个名为“鬼节捉鬼”的测试,证明了360浏览器存在私自上传“孤岛页面”等隐私内容到360搜索的行为。
这类利用客户端上传信息并放到搜索上的行为,可能引发网民隐私大面积泄露。如果一位证券公司的工作人员,不慎用360浏览器查看了客户的姓名、银行账号、密码等信息,那么客户账号和密码可能就会被搜索到并公之于众;如果一个公司高层,用360浏览器查看了公司内部机密数据,那么这个公司的核心商业机密也可能就会被竞争对手直接搜索到。
国家版权局明确指出:360涉嫌侵权必须整改
Robots协议,又称机器人协议或爬虫协议,该协议就搜索引擎抓取网站内容的范围作了约定,包括网站是否希望被搜索引擎抓取,哪些内容不允许被抓取,网络爬虫据此“自觉地”抓取或者不抓取该网页内容。自推出以来Robots协议已成为网站保护自有敏感数据和网民隐私的国际惯例,包括百度、谷歌、雅虎在内的所有搜索服务提供商都自觉严格遵守。
2012年8月,360搜索悄然上线后不久即违反Robots协议,强行抓取百度旗下网站百度知道、百度百科、百度贴吧、百度旅游等内容。360搜索在百度Robots文本中还未将360爬虫写入的情况下,违反Robots协议内容,强制对“百度知道”、“百度百科”等百度网站内容进行了抓取。
百度公司认为,奇虎360的行为违背了国际通行的行业规则、不顾百度的权利声明和技术措施,非法抓取、复制百度网站内容,直接以快照形式向网民提供,严重侵害了百度的合法权益,构成了不正当竞争。随后,百度公司将奇虎360诉至北京市第一中级人民法院,该案于今年2月23日正式立案。
早在2012年12月28日,国家版权局在打击网络侵权盗版专项治理“剑网行动”新闻通气会上就指出:360综合搜索提供百度网页快照不适用“避风港原则”,对于百度拥有权利的作品,360要通过网页快照抓取,必须要取得百度公司的授权,未经授权随意抓取百度拥有版权的作品属侵权行为。并要求360综合搜索进行整改,同时将视360的整改情况再采取进一步的管理措施。
不过,奇虎360公司无视国家版权局指示,依然继续违反roborts协议,违规抓取百度百科、百度知道等版权内容。
奇虎360引发的系列不正当竞争也引起其他国家权威部门高度重视。今年1月,北京市工商局对奇虎360利用“360安全卫士”在浏览器领域实施不正当竞争行为予以行政告诫。今年7月,国家工商总局不点名指出,奇虎360自2007年起就利用其在安全软件方面所占有的优势地位,采用多种方式,捏造虚假事实或扭曲、隐瞒竞争对手产品的真实情况,恶意打击竞争对手,严重损害了竞争对手的商业信誉和商品声誉。
百度:360违反Robots协议可能导致网民隐私泄露
据中国之声《央广新闻》报道,由于360搜索并不遵守搜索引擎通用的Robots协议,导致很多网站出于安全和隐私的考虑、不允许搜索引擎抓取的一些内网信息,也被泄漏在了360搜索上,这些隐私甚至可能包括银行帐号、密码、内部邮件等一些信息。
百度公关部郭彪对此表示,此前媒体报道的宝钢、AMD、台湾长庚大学等知名机构内部要求卸载360全部产品,正是因为担心内部商业信息和个人隐私可能被上传泄露。Robots协议的目的,也是为保护网站数据和敏感信息以及用户个人信息和隐私不被侵犯。作为隐私保护的国际通行规范,Robots协议应该得到业内的共同遵守,这也是最大程度保护网民隐私和利益的前提。
“如果百度都无法以Robots协议保护自己,那么淘宝、京东等商业数据网站,国内大量中小网站,甚至企业内网,就更没有保护自己的能力了。”百度公关部郭彪认为。
据百度介绍,早在2008年,淘宝通过Robots协议以保护商业信息为由不同程度禁止百度、谷歌等搜索爬虫对其商品信息的抓取。尽管淘宝数据存在巨大商业利益,百度在技术上也完全具备抓取能力,但百度严格遵守了Robots协议,立即停止了抓取淘宝网内容。
2012年11月,中国《互联网搜索引擎服务自律公约》首次将遵守Robots协议(爬虫协议)的规定纳入实质性条款,确定了Robots协议作为行业规范的地位。《自律公约》第七条明确指出,搜索引擎服务应当“遵循国际通行的行业惯例与商业规则,遵守机器人协议(Robots协议)”,第九条则规定了违反Robots协议抓取内容的企业,应在收到权利人符合法律规定的通知后,及时删除、断开侵权链接,努力维护健康有序的网络环境。
据悉,百度、搜狗、360等12家搜索引擎服务商现场签署了公约,就Robots协议相关规定达成一致。但360搜索在自律公约签署之后仍然继续抓取百度相关内容网站内容和快照结果。
专家观点:违反Robots协议可能导致行业大乱
百度公关部援引中国社会科学院信息化研究中心秘书长姜奇平的观点指出,Robots协议作为一项行业普遍接受的规范,它对企业和个人隐私保护都有重要意义。“如果就这起纷争打个比方,就类似客人在酒店住宿时在门上挂了一块‘请勿打扰’的牌子,但现在有服务员说要给客人提供贴心的服务,强行摘下牌子进入房间。”
搜狗CEO王小川此前也曾表示,欢迎360做搜索,但360搜索违反Robots协议,是不正当竞争,需要政府作为。知名IT评论人洪波更是直接指出,“(360无视Robots协议)这样的行为不及时从法律和政府监管上制止,所有网站都可以像360一样践踏行业规则的底线,整个互联网行业将大乱。”
知名知识产权律师赵占领认为,360采用技术手段避开百度设置的版权保护措施,未经许可直接抓取并复制相关产品网页,涉嫌著作权侵权。同时360通过隐蔽访问来源等技术绕开了百度设置的保护措施,未经许可加以抓取,则涉及不正当竞争。北京市汉卓律师事务所首席律师赵虎也表示,根据《侵权行为法》和《民法通则》等一系列法律法规的规定,360搜索行为已经违法,由于360搜索的违法行为涉及面广、涉及人多,已经侵犯了社会公共利益,政府部门不能坐视不管,必须进行调查和处理。
国内外判例:违规抓取相当于“对不动产的非法侵入”
事实上,关于Robot协议的法律纷争此前在国内外都曾出现。对于Robots协议,早在12年前,美国加州北部的联邦地方法院就在著名的eBayVS.Bidder'sEdge案中引用Robots协议对案件进行裁定。针对专门提供拍卖信息的聚合网站Bidder'sEdge违反Robots协议强制抓取ebay网站内容的行为,受理此案的美国联邦法官在经过多方调查取证后做出裁定,认定BE侵权成立,禁止了BE的违规行为。在法官看来:“eBay的网站内容属于私有财产,eBay有权通过Robots协议对其进行限制。”违规抓取的行为无异于“对不动产的非法侵入。”
同样在国内,垂直搜索引擎爱帮网也因未经允许抓取大众点评网的大量内容也被判败诉。
2008年,大众点评曾状告爱帮网,以“垂直搜索”之名,无视Robots协议,将大众点评花费心血组织用户发布的点评内容抓到自己的平台上。最终,法院判决爱帮网败诉,除了赔偿最高限额外,也要立即停止这一侵权行为。法院认为,这些信息内容被爱帮网未付出劳动、未支出成本、未做出贡献,却直接利用技术手段在爱帮网上展示,并以此获取商业利益,属于反不正当竞争法理论中典型的“不劳而获”和“搭便车”的行为。 |