文章详情页

python - scrapy抓取知网response的内容重复

浏览：214日期：2022-06-27 08:47:44

问题描述

遍历请求翻页的url

for i in range(3): yield Request('http:xx/page/%s'%str(i),callback=self.parse_page)

结果response请求成功但是每次内容都一样的没变化都是第一次请求时的内容，但是用postman分别请求分页的url就没有这问题。= = 是被ban了吗之前就不会这样

问题解答

回答1：

那就要分析一下用postman或者浏览器访问时请求的header头和用scrapy请求头有什么区别

回答2：

被反爬识别到了

回答3：

看下控制台打印的log，看看是否正确抓取了下一页2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,注意最后一个x(http:xx/page/x)是否是变化的

Python 编程

上一条：PC端访问却变成移动端地址问题#python#scrapy下一条：【python小白】问关于导入嵌套的包的问题

相关文章：

1. javascript - 微信小程序如何实现这种左滑动出现删除的办法？有相关api吗？2. web服务器 - ubuntu下布置apache加wsgi加python3. tp6 事务闭包操作问题4. 主从复制 - MySQL 主从延迟 300s 以上，求大神解答5. python打开.py文件的时候出现window无法打开该文件是怎么回事呢？6. javascript - sublime快键键问题7. css - 图片的宽度发生变化而高度却没有相应变？8. docker 17.03 怎么配置 registry mirror ?9. dockerfile - 为什么docker容器启动不了？10. docker gitlab 如何git clone？

排行榜

					
					javascript - 微信小程序 如何实现这种左滑动出现删除的办法？有相关api吗？
javascript - sublime快键键问题
主从复制 - MySQL 主从延迟 300s 以上，求大神解答
dockerfile - 为什么docker容器启动不了？
docker gitlab 如何git clone？
python打开.py文件的时候出现window无法打开该文件是怎么回事呢？
web服务器 - ubuntu下布置apache加wsgi加python
tp6 事务闭包操作问题
css - 图片的宽度发生变化而高度却没有相应变？
docker 17.03 怎么配置 registry mirror ?
docker - 如何修改运行中容器的配置
				

热门标签