文章详情页
python - scrapy 爬取pages比实际进入items的多得多?
浏览:117日期:2022-07-23 10:55:26
问题描述

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)
为什么我使用scrapy爬取的时候访问pages要比实际进入items的的多的多?就是爬了半天items里没有几条数据入库的有什么办法解决么?
问题解答
回答1:重定向了,你看到了吧,重定向就得请求两个页面啊。还有就是看有不有页面解析发生了错误。
相关文章:
1. javascript - ajax 图片文件与文本框数据一起提交上传处理2. thinkPHP5中获取数据库数据后默认选中下拉框的值,传递到后台消失不见。有图有代码,希望有人帮忙3. python - 有什么好的可以收集货币基金的资源?4. windows-7 - win7下使用cmder,如何设置vim的tab为4个空格?5. python 多进程 或者 多线程下如何高效的同步数据?6. javascript - CSS图片轮播显示问题7. mysql 怎么做到update只更新一行数据?8. MySQL的SELECT...FOR UPDATE究竟起什么作用9. javascript - 关于js高级程序中的问题10. word-wrap该如何使用?
排行榜

网公网安备