文章详情页
python - 为什么感觉 pyspider 爬取的速度好慢
浏览:231日期:2022-08-08 09:43:03
问题描述
为什么感觉 pyspider 爬取的速度好慢(比自己直接用 requests 和 bs慢多了),是不是因为有些网页会 retry,不过成功率倒是比自己爬取的高多了。是不是我的使用方法不对?求解释
问题解答
回答1:这里可以设置 web ui 控制台上的 rate/burst 参数来调节速度,rate 是 每秒抓取的数量,burst 是并发的数量,默认是 1/3 所以比较慢,还是对这个工具了解不够呀
回答2:我没有用过框架来写爬虫,但是我在自己写爬虫的时候,并发写起来,模型越复杂(如线程控制,线程状态监控),效率是越低的。
相关文章:
1. css - 文字排版问题,内容都是动态抓出来的,字数不一定。如何对齐啊2. css3 - 微信前端页面遇到的transition过渡动画的bug3. 网页爬虫 - 关于Python的编码与解码问题4. git - 在web应用分布式部署的情况下怎么进行配置更新5. css3 - 微信小程序如何把radio改成2个选择按钮的样式6. 微信开放平台 - ios APP能不能打开微信然后通过微信跳转到指定的URL?7. php - TP5的登录验证问题8. css - input间的间距和文字上下居中9. javascript - imgzoom插件所引发的bug血案!!!!10. php ZipArchive关于不同目录文件压缩
排行榜

网公网安备