谈谈爬虫背后的法律风险

最近的IT公司违法案件愈来愈多,看了不少由于爬虫,数字货币,博彩网站外包等被抓的事情,
程序员

给你们提个醒,打工注意不能违法,写代码背后也有法律风险。安全

1、爬虫背后的法律风险

程序员被关监狱456天,只因外包赌博软件网络

只因写了一段爬虫,公司200多人被抓工具

你们都说技术无罪,可是也要看场景,听说如今国内作我的信用评测的,都是要用户受权各类帐号,而后爬取信息。网站

先来看一些法律法规里对我的信息使用的规定:搜索引擎

《中华人民共和国网络安全法》

2016年11月7日发布的《中华人民共和国网络安全法》明确“我的信息”是指是指以电子或者其余方式记录的可以单独或者与其余信息结合识别天然人我的身份的各类信息,包括但不限于天然人的姓名、出生日期、身份证件号码、我的生物识别信息、住址、电话号码等,就网络服务中的我的信息保护问题做出系统规定以下:spa

一、保护我的信息:
网络产品、服务具备收集用户信息功能的,其提供者应当向用户明示并取得赞成;涉及用户我的信息的,还应当遵照本法和有关法律、行政法规关于我的信息保护的规定。索引

二、合法收集使用我的信息:
网络运营者收集、使用我的信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者赞成。不得收集与其提供的服务无关的我的信息,不得违反法律、行政法规的规定和双方的约定收集、使用我的信息,并应当依照法律、行政法规的规定和与用户的约定,处理其保存的我的信息。网络安全

三、不得向他人提供我的信息:
网络运营者不得泄露、篡改、毁损其收集的我的信息,未经被收集者赞成,不得向他人提供我的信息,但通过处理没法识别特定我的且不能复原的除外。get

 

《规范互联网信息服务市场秩序若干规定》

《规范互联网信息服务市场秩序若干规定》(工业和信息化部令第20号,如下简称“20号文”)就互联网信息服务提供者信息搜集规定以下方面:

一、搜集须经许可:未经用户赞成,不得搜集与用户相关、可以单独或者与其余信息结合识别用户的信息(“用户我的信息”),但法律法规另有规定除外;
二、限定搜集范围和用途:经用户赞成搜集用户我的信息的,应当明确告知搜集和处理用户我的信息的方式、内容和用途,不得收集其提供服务所必需之外的信息,不得将用户我的信息用于其提供服务以外的目的;
三、用户我的信息保障:互联网信息服务提供者应当增强系统安全防御,妥善保管用户我的信息,未经用户赞成,不得向他人提供用户上载信息,可是法律法规另有规定的除外。

爬虫本质是一种工具,一种用机器人代替人手操做、搜集信息提升效率的工具。工具无罪,有罪的是如何使用。

对于涉及法律风险的数据爬取要求,程序员最好在采集前和老板深聊一下,明确法律风险,或者事先和公司签署一份免责协议。

 

2、网络爬虫怎么作比较好

 若是经过窃取或者其余方法非法获取公民我的信息等我的信息、商业机密,情节严重(刑九之后 5000 元入罪)则构成侵犯公民我的信息罪,量刑分三年如下和三至七年两档,运气好的缓刑走起,固然民事责任依然是免不了的。

因此,面对领导危险的爬虫请求,程序员们该好好衡量下了。

咱们都知道,互联网搜索引擎要遵照Robots 协议,若是遵照Robots 协议,没有任何越权的行为,获取的也是公开能够查询的非隐私级的信息,那么,违反法律的风险会比较小。

除了遵照“Robots 协议”,还有如下的几条:

一、若是你爬虫获取信息,是为了证实被爬公司的数据造假,其获取的数据也都是经过公开渠道能够查询的,那么,在获取信息后公布于众的行为并不违法,也不侵犯被爬公司的民事权益。可是,若是你爬取公开免费的信息,是用来进行违法操做,好比造假、诽谤等,就有隐患了。

二、若是你利用爬虫获取其余公司的公开信息数据,用于自身公司的经营。而被爬公司的信息是投入了大量人力、财力,通过常年积累得到的,而且被爬公司自己也采起了反爬措施。这种状况下,虽然信息是公开的,但信息自己具备较高的商业价值,可以给使用者带来商业利益,此时的爬虫也是违法的。

三、若是你未经平台受权,强行突破反爬措施,致使被爬网站的运行受到严重影响,这种行为明显是违法的,这里涉及的就是咱们上一个技术篇讲到的破解犯罪了。

四、若是你是第三方应用,想要经过开放平台获取用户信息时,更要注意受权问题。从用户对平台的受权、平台对第三方的受权、再到用户对第三方的受权,三重关卡都要经过才合法。

 

3、总结一下

  • 接外包项目要谨慎
  • 互联网金融从业有风险
  • 对于危险的爬虫任务,勇于说不
相关文章
相关标签/搜索