文章详情页

Python爬取YY评级分数并保存数据实现过程解析

浏览：51日期：2022-07-23 16:44:35

前言

当需要进行大规模查询时（比如目前遇到的情形：查询某个省所有发债企业的YY评级分数），人工查询显然太过费时，那就写个爬虫吧。

由于该爬虫实在过于简单，就只简单概述下。

一、请求端

通过观察YY评级的网页信息，如下图（F12或右击进入检查，点击network—>XHR—>headers）。

红色框表明是个get请求（其实这种网页基本都是Ajax get，需要总结实际url的规律的）。

绿色框即为实际URL，通过分析该URL，其由两部分组成。前半部分为“https://web.ratingdog.cn/v1/search?”，后半部分为黄色框内内容用“&”符号连接后的结果。黄色框内的内容，只有企业名称为变量，且为已知变量，那URL即可据此确定了。

Python爬取YY评级分数并保存数据实现过程解析

另外需注意，YY评级需要登录才可查询数据，在构建头部信息进行访问时，一定要提前登录，并在头部信息中放入登录信息和登录状态。

二、响应端

通过观察网页的响应信息（F12或右击进入检查，点击network—>XHR—>response），如下图。响应信息及其简单，我们所需要的YY评级分数安详地躺在那里，简单到一个正则表达式就可以提取出该数据。正则如下：

'msg'.*?'IssuerName':'(.*?)','YYRating':'(.*?)/10','IntrinsicRating'.*?'

Python爬取YY评级分数并保存数据实现过程解析

三、代码

所需数据较少，代码相对简单，就不建立函数了，直接一路到底吧。如下：

Python爬取YY评级分数并保存数据实现过程解析

运行代码后，得到结果如下。安徽省的100多条数据，就到了本地了

Python爬取YY评级分数并保存数据实现过程解析

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持好吧啦网。

Python 编程

上一条：Python如何在main中调用函数内的函数方式下一条：基于Python绘制个人足迹地图

相关文章：

1. Django中如何使用Channels功能2. 教你JS更简单的获取表单中数据(formdata)3. 详解JS浏览器储存4. 多页vue应用的单页面打包方法(内含打包模式的应用)5. python爬取股票最新数据并用excel绘制树状图的示例6. 删除docker里建立容器的操作方法7. idea导入maven项目的方法8. 解决IDEA2020控制台乱码的方法9. idea删除项目的操作方法10. 详解Java的Exception异常机制

排行榜

					
					详解Java的Exception异常机制
教你JS更简单的获取表单中数据(formdata)
解决IDEA2020控制台乱码的方法
删除docker里建立容器的操作方法
idea删除项目的操作方法
idea导入maven项目的方法
Django中如何使用Channels功能
详解JS浏览器储存
多页vue应用的单页面打包方法(内含打包模式的应用)
python爬取股票最新数据并用excel绘制树状图的示例
一文学习Java NIO的ByteBuffer工作原理
				

热门标签