如何获得企业信用评级信息信息系统,信用中国网站上有信息公示,信用在辽宁站的网站上我们可以很方便的查询企业信用评级信息:
网站一共收录辽宁了7602条企业评级记录:
网站分析
之前在做网络抓取案例时,总也找不到支持POS信息T方式的网站,最近却企业总能碰到,这个网站又信息系统是一个支持POST方式的网站:
竟然连Cookie都不需要,看起来,我们只需要提供:
- Content-Type:请求内容的类型;
- User-Agent:让抓取看起来更像人工,给网站传递信息,告知使用什么浏览器;
- Query:主要的查询参数,页码和每页显示的条数;全国
试抓
因为要测试什么样的信息头,能通过网站服务器验证,所以我们用参数管理器保存下面几个参数:
- Content-Type:
- User-Agent:
- url:
query是record格式,我们系统单独建立一个:
然后我们来写一个试抓的查询:
主要是这两句,当然这是经过我测试之企业后的,查询参数查询传递时,我用了Content,不成功,同时使用Query Content是可以的,去掉Content只使用Query也是可以的,所以最终信息确定用上面的结构来抓公示取。
定义函数
我们需要把Query的record直辽宁接写到公式中,因为我们需要通过参数p的变化,来抓取不同页码的数据:
抓取
用List.Transform列表抓取全部的381页内容:
展开整理,我们公示发现表中的时间使用的是tim信用estamp,要转变成我们正常使用的日期:
一共有三列:创建时间,发布时间,全国有效时间,然后修改下数据类型就可以了。
加载到Power BI Desktop:
按照行业占比:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至123456@qq.com 举报,一经查实,本站将立刻删除。