1. 首页
  2. > 税务筹划 >

全国工商信息公示系统数据爬虫(工商信息公示系统查询系统全国)

“全国各省市三百多行业数据信息采集”、“python爬虫程序数据采集代写软件,专业老手,定制化服务”……在某二手交易平台上,有不少提供所谓“大系统数据”采集信息服务的商家,声称可进行“专业爬虫”、“各大网站数据采集、数据处理、数据分析”,还有商家叫卖数据信息采集器,购买软件“无限量”导数据还帮忙介绍“客户。




二手交公示易平台上一卖家自称“专业老手”,可代写各类爬虫软件,提供订制数据订制服务。

随后,南都记者再随机联系二手平台上一位售卖简历的卖家,对方称他手上有上万份简历,“58同城、智联招聘、赶集网的都有”,每份简历售价1.5元,“全国随机,不指定地区”,购买量大价格还可以再优惠。


卖家出售的“智能云”软件,称可采集全网多个行业的大数据信息。信息

“网络数据订制 云端代采集 京东淘宝 车主 金融等所有行业信息采集,拍下发软件”,二手平台上一位卖家介绍。据该卖家提供的软件演示视频显示,这是一款名叫“智能云”的软件,售价980元,可采集的数据信息覆盖地图商家、搜索引擎、企业信息、车主信息等全网大数据,软件有导入微信通讯录、qq群成员提取、微信群发、微信营销、qq营销、论坛营销等多个功能界面。卖家介绍称,该软件可用来为各行业进行大数据引流、实现精准营销。


卖家发给记者的简历信息采集器演示页面。

一位出售58简历信息采集器的qq网友“大神-售58简历采集器”向南都记者表示,他的软件可实时导出58同城、赶集网简历数据,采用的是“双接口”和爬虫技术,软件安装在PC端后,设置好条件便可进行实时数据导出,“上手快好操作”,售价为700元/月。根据卖家发来的视频截图,这种简历采集器设有城市、兼职岗位、性别、年龄和发布时间等筛选条件,采集到的数据包括姓名、手机号码、学历信息、工作年限、期待月薪等个人信息。


非法爬虫窃取“大数据”信息已成公司数据化运营


爬虫窃取用户信息再加以售卖盈利的现象在业全国内普遍存在


国家网信办去年发布的《2017年数字中国建设发展报告》显示,2014-2017年,中国大数据产业持续高速增长。2017年中国大数据产业规模达到4700亿元,同比增长30%,预计2020年中国大数据市场产值将超万亿。


看似风光无限的大数据行业,其背后的大数据杀熟、隐私安全、非法爬取用户信息等乱象早已暴露无疑。有数据运营行业人士指出,通过爬虫等技术窃取用户信息、再加以售卖盈利的现象在行业内很普遍。


去年8月,南都记者报道了浙江绍兴越城警方侦破“史上最大规模数据窃取案”,警方阻止遭窃取的30亿条公民信息泄露。涉案的瑞智华胜等三家公司通过与网络运营商合作的机会,获取运营商服务器登录许可,并通过技术手段从运营商服务器抓取采集网络用户的登陆cookie数据,进而非法登陆网络用户的淘宝、微博等账号,获取最前端的公民个人信息,并进行强制加粉、订单爬取等行为,从中牟利,公司年营收超过3000万元。


有互联网安全专家指出,从运营商的层面进行流量劫持和清洗,相当于从源头上数据就丢失了,位于下游的互联网公司的安全防护能力再强,也无法防范。


去年信息8月,南都联合阿里安爬虫全部发布的《2018网络黑灰产治理研究报告》显示,2017年我国网络安全产业规模为450多亿元,而黑灰产已达近千亿元规模,用户信息泄露、网络黑客勒索和通讯信息诈骗等问题仍频繁出现。


而在网络黑灰产的整条产业链中,利用各种手段爬取、窃取或者通过买卖的方式获得个人信息,成为黑灰产获利的主要方式,由此滋生出的电信诈骗、敲诈勒索等下游违法犯罪行为,对公民个工商人信息安全、财产安全造成严重威胁,成为侵蚀互联网经济正常运转的毒瘤。据不完全统计,从2015年开始,互联全国网黑灰产业从业人员就已经超过40万。


号称中国最大简历大数据公司巧达科技被查


今年4月,北京警方破获的巧达科技非法获取计算机信息系统数据案引发关注。这个号称中国最大的简历大数据公司,专业提供招聘工具软件和大数据分析服务,拥有一系列的人力资源类大数据产品,包括乔大招、妙招网及爱伙伴等,还曾获得天使轮、A轮和B轮融资,资方包括李开复的创新工场、中信产业基金等。


工商信息显示,巧达科技成立于2014年7月,注册资本为1050万元,其经营范公示围包括技术开发、技术服务、数据处理等。今年工商4月22日,北京市海淀区公安分局在官方微信公号上透露了巧达科技非法获取计算机信息系统数据一案的最新进展。


据警方披露,2018年10月,某互联网公司报案称,其公司员工发现有人在互联网上兜售疑似为该公司用户信息的数据。经初查,民警判断该公司的用户信息数据存在被人非法窃取的可能。通过对该公司服务器日志进行调取、梳理、分析,初步还原了数据被窃取的全过程。


警方发现,巧达科技公司在未经授权的情况下,通过利用大量代理IP地址、伪造设备标识等技术手段,绕过该公司服务器防护策略,大量恶意窃取存放在数据服务器上的用户数据。且在窃取过程中,由于传输数据量过大,导致服务器数十次中断服务,影响上千万用户正常访问,给该公司带来了严重的经济损失。


据新华社报道,这家企业非法爬取用户数据,数量之大、牟利之巨,令人咋舌。这些简历信息等数据被用在教育培训、保险、招聘等行业,为巧达科技带来了大量收入。公开数据显示,2017年,该公司全年收入4.11亿元,净利润1.86亿元。巧达科技产品合伙人刘博也曾在采访中称公司的商业模式为“获取简历、数据变现”。目前,巧达科技公司法人王某某等36人已被检察机关依法批准逮捕。


非法爬取数据存在法律风险


未经平台授权爬取数据信息可能构成侵权、违法甚至犯罪行为


在对上述所谓“大数据”软件提供信息采集服务的现象进行调查中,南都记者注意到,有卖家在其业务介绍中自证清白称“违法乱纪的不做”,所提供的软件外包和数据爬取等业务只爬取各种网页、App公开的“看得见”的数据。


那么,按照大数据采集商的观点,如果爬取的是网页等公开数据,这种行为就真的合理合规?


事实上,非法获取数据存在诸多法律风险,虽然利用爬虫软件等各种技术手段爬取互联网数据的行查询系统为广泛存在,但为保护自身数据不被爬取,很多企业也都设置了反爬虫策略。当网络爬虫非法抓取数据信息时,可能构成的侵权、违法甚至犯罪行为主要包括危害计算机信息系统安全类、非法获取公民个人信息类和侵犯知识产权类等。


近年来,企业之间通过数据爬取引发的对于数据权益争夺的各种案件层出不穷。比如,新浪诉脉脉抓取新浪微博用户信息案、淘宝诉美景不正系统当竞争案等,对于非法爬取企业数据的行为,法律也更倾向于保护企业经营者查询系统的权利。


《网络安全法》第27条规定,任何个人和组织不得从事“窃取网络数据”等危害网络安全的活动,不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安全活动的程序、爬虫工具。


述绍兴警方破获的这起大规模数据窃取案件中,上市黑产公司在运营商服务器内放置恶意程序清洗流量,导致30亿条用户数据被窃取。近日,公司法定代表人周某某等7人因涉嫌非法获取计算机信息系统数据罪,被检察机关提起公诉。


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至123456@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息