文章详情页

python - 如何爬取跳转网站的数据

浏览：191日期：2022-06-30 14:37:44

问题描述

目前在学习一些爬虫的知识，对于一些复杂的网站使用selenium进行爬取。碰到一个问题，我需要爬取的工单网站（不知道密码）需要先通过登录一个鉴权系统，然后鉴权系统页面点击其中的工单系统连接，就会自动免登录跳转到工单系统网站，这种系统的数据我该如何使用爬虫进行抓取？以下是鉴权系统selenium拿到关于工单系统的html

问题解答

回答1：

用firefox的扩展selenium ide录制一遍操作。然后导出为python文件。改改运行就可以了。

建议你去读读虫师写的书。

回答2：

例如使用requests库作为爬虫的话，先创建session()，A登录，B是跳转的页面即可。

T=requests.session()A=T.post(url=url,data=data)B=T.get(url=url)

创建的T就代表存储的cookie，会一直保留

Python 编程

上一条：python如何获得一个url地址对应的跳转后的最终网址下一条：python - Django如何在View中发送异步HTTP请求？

相关文章：

1. PHPExcel表格导入数据库怎么导入2. node.js - 微信小程序websocket连接问题3. javascript - 请教，用原生js插入html的问题4. objective-c - 微信支付的问题5. objective-c - iOS开发使用什么对html进行代码高亮6. javascript - Vue 自定义控件v-model双向绑定7. Atom安装出现问题8. php程序员工具箱装的mysql怎么删除啊9. javascript - table td单元格生成tr问题10. python - 使用pandas的resample报错