文章详情页
网页爬虫 - Python爬虫返回状态码与实际情况不符?
浏览:305日期:2022-09-03 18:57:11
问题描述
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html
比如这个爬虫,输出状态码是200。

可是直接访问http://www.sxxrcs.com/was5/web/是404,抓包响应的也是404,请问这是为什么?

问题解答
回答1:用requests吧
import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:
200正常啊,requests方便快捷。
相关文章:
1. python 字符串匹配问题2. redis sentinel怎么跑守护进程以及日志记录位置的?3. django - Nginx uwsgi 进程问题4. html - angular项目中如何让外链网页在本项目中展示?5. javascript - sublime快键键问题6. Python异常退出时保存进度?7. 请问PHPstudy中的数据库如何创建索引8. 前端 - 这段代码一直生效不了,查半天因为 top: 0px; 分号后一个隐藏的东西,也不是占位符...删了就可以生效,这是什么情况。。9. 使用git管理webpack的代码时多人怎么协作?一般托管哪些文件?10. python for循环中的函数只能运行一次?
排行榜

网公网安备