一、网站数据抓取情况描述
如果一个程序需要获取某个网站的数据,比如国家气象局天气预报数据:http://m.weather.com.cn/data/101010100.html。通过访问站点,得到json结果,然后程序解析之后显示出来。
1、这样的方式触犯了法律了吗?如果触犯了法律,触犯了哪条法律法规?如果犯法,在软件申明中指出:“数据来源于某某网站,请勿用于商业用途,否则后果自负”,有效么?
2、对于免费的和付费的软件而言,有什么区别?
3、不同的使用范围会有不同的结果吗?比如某个大学或者面向大众或者仅仅是个人。
二、网站数据抓取法律分析
1、类似国家气象局、国家统计局的数据,我觉得抓取没问题,因为这是政府部门提供公共信息的一部分。
2、如果抓取的商业网站的数据,用于商业使用,严格说则有问题,存在侵权的可能。类似“数据来源于某某网站,请勿用于商业用途,否则后果自负”这样的声明,并不能避免侵权责任。一般网站在robots协议中会明确标明搜索引擎哪些页面可以抓取,哪些页面不能抓取。但这只是行业内的惯例,并没有法律上的强制力。
三、案例解析
根据一些判例,这种强行抓取信息的行为有可能构成侵犯著作权和不正当竞争。如大众点评网诉爱帮网的判决书中指出“这些信息内容被爱帮网未付出劳动、未支出成本、未做出贡献,却直接利用技术手段在爱帮网上展示,并以此获取商业利益,属于反不正当竞争法理论中典型的‘不劳而获’和‘搭便车’的行为。”
之前大众点评网曾状告爱帮网不正当竞争,北京市一中院2011年7月终审判决爱帮网构成不正当竞争:“爱帮网对大众点评网的点评内容使用,已超过了适当引用的合理限度,事实上造成爱帮网向网络用户提供的涉案点评内容对大众点评网的相应内容的市场替代,其行为是有竞争目的的市场竞争行为,已构成反不正当竞争法所禁止的不正当竞争行为。”爱帮网被判在其网站刊登声明消除影响,赔偿大众点评网50万元(法定最高额)。
这份判决特别指出“技术的合法性并不表明垂直搜索网站在使用该技术时可以不受任何限制,使用垂直搜索技术的网站对于特定行业网站的信息的利用,应控制在合理的范围内,不得对该网站造成市场替代的后果。”“这些信息内容被爱帮网未付出劳动、未支出成本、未做出贡献,却直接利用技术手段在爱帮网上展示,并以此获取商业利益,属于反不正当竞争法理论中典型的‘不劳而获’和‘搭便车’的行为。”虽然中国并不是判例法国家,但像北京市一中院做出的互联网案件判决有很大的影响力,有时会实际起到确立标准的作用。
四、结论
从行业现状看,抓取数据引发的纠纷涉及很复杂的举证责任,采用法律手段解决成本很高,结果也不确定,所以主要还是技术上的攻防战。
