文章详情页
python - scrapy 爬取pages比实际进入items的多得多?
浏览:180日期:2022-07-23 10:55:26
问题描述

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)
为什么我使用scrapy爬取的时候访问pages要比实际进入items的的多的多?就是爬了半天items里没有几条数据入库的有什么办法解决么?
问题解答
回答1:重定向了,你看到了吧,重定向就得请求两个页面啊。还有就是看有不有页面解析发生了错误。
相关文章:
1. 前端 - html5 audio不能播放2. java - 如何将一张普通图片转成64级灰度图片?3. 为什么我ping不通我的docker容器呢???4. css - chrome下a标签嵌套img 显示会多个小箭头?5. Browser-sync安装失败问题6. Ghost安装Win8出现1868问题的解决方案7. javascript - Vuex 实例名称只能是store吗8. javascript - Vue 自定义控件v-model双向绑定9. javascript - 使用echarts做一个横向的柱状图,但是数据超出坐标轴范围了怎么办?10. javascript - js读取excel其中一列中的一个值是0.3556但是读出来是0.35559999999999997?
排行榜

网公网安备