文章详情页
java - QQ空间爬虫总是被封号
浏览:139日期:2022-09-24 17:58:56
问题描述
抓取QQ空间说说但是 总是被封号 可以给提出一些解决方案吗?如何既可以快速 又可以不封号!谢谢啦!
代码在github上地址https://github.com/20100507/Q...
问题解答
回答1:反爬虫策略:
1、识别请求头,判断是否是爬虫2、记录请求频率、路径和访问ip,判断是否是爬虫3、请求参数中进行加密或复杂加密,增加爬虫开发的难度(如淘宝的ua算法)4、复杂验证码
应对反爬虫策略:
1、在爬取过程中,适当切换代理ip2、适当降低请求频率3、请求头模拟成浏览器的请求,也就是用户正常访问的请求
你的问题,主要可以通过定时切换ip,或一旦被封再切换ip,来解决,可以考虑去“站大爷”等代理ip网站付费获取,或者去多用几个电信账号,用ASDL拨号来切换ip。
标签:
qq
相关文章:
1. java - Atom中文问题2. javascript - 怎么简写这段jQuery功能?3. android - webview 想打开word ppt excel pdf 大家有做过的吗4. angular.js - 请教一个关于angularjs的小问题5. angular.js - 这是什么错?谁遇到过?给点提示6. mac里的docker如何命令行开启呢?7. 关于Apache无法启动的程序的方式是怎么解决的8. angular.js - 用angular2-cli打包项目之后,跳转路由刷新会报404的错误9. 表单内容含有多选、单选和下拉怎么通过ajax传到数据库,(请把控制器部分和model部分也带上)10. angular.js - angularjs 使用modal 选中modal中的li列表后传值
排行榜
