文章详情页

python - 爬取某网站时需要浏览器刷新一次才能返回真实的页面数据？

浏览：221日期：2022-08-10 17:31:34

问题描述

请求所需参数全部带上了，并且已带上cookies,已修改header，拿到的数据是提示刷新的HTML，如图： python - 爬取某网站时需要浏览器刷新一次才能返回真实的页面数据？原网页是动态加载的瀑布流，即往不断下拉就不断有内容呈现出来，静候大神，目前采用scrapy框架，暂时还不想上selenium+phantomjs，太重了

问题解答

回答1：

动态加载的数据你应该找ajax api请求，而不是在网页找，工欲善其事必先利其器，善用 F12。

回答2：

这种情况比抓取一个代理ip网页，使用cookie但是报错好解决多了＝＝，你完全可以判断当前页面内容然后进行模拟刷新～重要的是保持会话。

如果还不行的话，可以加referer再试一试

Python 编程

上一条：flask - python 多维字典遍历下一条：python - 关于基于tornado的websocket服务在本机上调试的问题

相关文章：

1. java - ssm框架jar包如何区分和管理？2. docker不显示端口映射呢？3. 如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？4. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？5. 前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~6. javascript - 关于js原生事件的绑定与解除绑定7. docker start -a dockername 老是卡住，什么情况？8. angular.js - angular中的a标签不起作用9. docker api 开发的端口怎么获取？10. docker容器呢SSH为什么连不通呢？

排行榜

					
					angular.js - angular中的a标签不起作用
Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
docker容器呢SSH为什么连不通呢？
golang - 用IDE看docker源码时的小问题
docker api 开发的端口怎么获取？
javascript - 关于js原生事件的绑定与解除绑定
docker start -a dockername 老是卡住，什么情况？
java - ssm框架jar包如何区分和管理？
docker images显示的镜像过多，狗眼被亮瞎了，怎么办？
docker不显示端口映射呢？
前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~
				

热门标签