文章详情页

linux - python 抓取公众号文章遇到验证问题

浏览：173日期：2022-06-25 14:22:41

问题描述

linux 下抓取微信公众号文章遇到验证问题！！！！！！！！

这是我要抓取的人民日报链接：http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1：首先浏览器上访问是正常的。2：linux下访问提示需要验证，以下是简单的代码

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

访问的结果如下： linux - python 抓取公众号文章遇到验证问题

补充说明下公众号链接的获取方式：1：先访问链接：http://weixin.sogou.com/weixi...2：再获取人民日报公众号的链接进行跳转。

问题解答

回答1：

都不模拟header请求头的，就能抓取吗，建议先模拟request header再试一下

回答2：

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3：

linux - python 抓取公众号文章遇到验证问题

现在在请求中加了header后，返回的错误是这样的。请各位大神麻烦再支下招

回答4：用request可以,本地环境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)内容在红色框那一行

linux - python 抓取公众号文章遇到验证问题

Python 编程

上一条：python - linux 下用wsgifunc 运行web.py该如何修改代码下一条：linux - python 安装 Anaconda 环境变量问题请教

相关文章：

1. 修改mysql配置文件的默认字符集重启后依然不生效2. java - mybatis源码分析3. python相关问题求解决，有偿4. angular.js - 用angularjs的service封装百度地图api出错，请问原因？5. css - 移动端h5播放器问题求解决，急急6. mongodb - windows7下mongod无法正常启动7. php - 类似Apple官网顶部3级导航该如何设计数据库？8. android - VideoView与百度Map冲突9. 作为新手，未定义索引username，求解，谢谢10. javascript - 豆瓣的这个自适应是怎么做的？

排行榜

					
					java - mybatis源码分析
修改mysql配置文件的默认字符集重启后依然不生效
python相关问题求解决，有偿
angular.js - 用angularjs的service封装百度地图api出错，请问原因？
css - 移动端h5播放器问题求解决，急急
mongodb - windows7下mongod无法正常启动
android - VideoView与百度Map冲突
angular.js - 关于指令link 中的创建变量问题
angular.js - ng-model如何绑定二选一的单选项框？
计算机 - 我学习了C语言，数据结构和一点点java基础，想自学C++，请问买什么入门书籍好？
javascript - 手机版网站导航条水平滑动减速效果是如何实现的
				

热门标签