文章详情页

javascript - Python 爬虫 Ajax 页面直接request获取居然速度比selenium慢。

浏览：181日期：2022-08-04 16:42:25

问题描述

因为在爬取的网站需要账号登陆，不方便公开。因此我只能这样大致性的咨询，实在抱歉。

我需要爬一个目标网站的数据，发现在点击下一页时候，网址并没有改变.通过源码确定是使用了js外加ajax的样子.通过chrome的控制台，捕获到点击下一页时候，向指定地址发送了一条带多个参数的get指令。

原先采用selenium+phantomjs的方式暴力无脑方式爬取，一个页面大概5S左右就能获取，实际用浏览器打开也是这个速度。为了爬取大量的数据，准备改用多线程+直接requests.get目标地址的方式来采集，但是发现采集速度非常的慢，从5S降到的20s左右。

请教下，出现这样现象的原因可能是什么？我该如何解决？请指教

问题解答

回答1：

抱歉浪费了各位的时间- -是我开始测试的时候，周围有人再下迅雷，网络炸了。抱歉抱歉

Python 编程

上一条：python - 使用pandas的resample报错下一条：python - 相当于分组数据的合并，两个列表生成dataframe，但长度不同

相关文章：

1. 一道关于 JavaScript 中 this 的题目的困惑2. mysql中datetime列如何做筛选？3. css3动画 - css3 animation初始动画卡顿是怎么回事？4. 点字符“” 在MVC Web API 2中进行请求，例如api / people / STAFF.452875. javascript - yo创建angular报错6. objective-c - 使用axios 通过vuex mutation修改数据 getter第一次获取失败第二次成功7. PHP中的$this代表当前的类还是方法？8. 使用weex扩展html5的项目存在ios不同版本的兼容性9. python - pip install出现下面图中的报错什么原因？10. html5 - api.douban.com/v2/movie/in_theaters?start=0&count=3 不在以下合法域名列表中

排行榜

					
					使用weex扩展html5的项目存在ios不同版本的兼容性
css3动画 - css3 animation初始动画卡顿是怎么回事？
objective-c - 使用axios 通过vuex mutation修改数据   getter第一次获取失败 第二次成功
python - pip  install出现下面图中的报错  什么原因？
点字符“” 在MVC Web API 2中进行请求，例如api / people / STAFF.45287
一道关于 JavaScript 中 this 的题目的困惑
javascript - yo创建angular报错
mysql中datetime列如何做筛选？
PHP中的$this代表当前的类还是方法？
Ant design vue中的联动选择取消操作
css3 实现一个线性渐变出现的问题？
				

热门标签