文章详情页
python - 爬虫如何获取onclick的链接
浏览:183日期:2022-09-08 15:53:14
问题描述
<a onclick='xxx(1)'>xxxx</a>
类似如上这种需要点击一下才会打开一个网页的,这种链接该如何获取呢?除了手工分析参数自己构造请求, selenium 定位模拟点击,还有什么方法么?
问题解答
回答1:如果js有做混淆或者加密,无法直接从代码中获取到链接的话,那只有模拟点击能做到了。
回答2:from bs4 import BeautifulSoup as bsfor a_tag in bs(html_body,’html.parser’).find_all(’a’): print(a_tag[’onclick’])回答3:
正则表达式提取呗
相关文章:
1. css - 文字排版问题,内容都是动态抓出来的,字数不一定。如何对齐啊2. git - 在web应用分布式部署的情况下怎么进行配置更新3. css3 - 微信前端页面遇到的transition过渡动画的bug4. 网页爬虫 - 关于Python的编码与解码问题5. 前端 - WebStrom安装了angularjs插件,但是没有语法提示6. 微信开放平台 - ios APP能不能打开微信然后通过微信跳转到指定的URL?7. selenium-selenium-webdriver - python 将当前目录加入到 环境变量8. css - input间的间距和文字上下居中9. javascript - imgzoom插件所引发的bug血案!!!!10. php ZipArchive关于不同目录文件压缩
排行榜

网公网安备