文章详情页
java如何爬取js处理后的代码
浏览:134日期:2023-12-07 11:18:37
问题描述
页面地址: http://acm.hdu.edu.cn/showpro...
爬取的目标:
想要爬取这些个公式的代码,Chrome按F12看到的代码:
但是爬取到的代码如下:
这个代码并不能显示正确的公式,貌似这些代码都是js生成的,该如何爬取到这些代码。
问题解答
回答1:这是MathJax工具解析的。在HTML代码中查看公式p的下一个id为MathJax-Element-X的script,复制里面的内容,在公式前后加两个$$(前后都是两个美元符,所以一共是四个)最后使用MathJax解析就可以了。说再多不如上图:
先抓包,把ajax请求抓出来,关键是看怎么构造该请求,主要是一些参数的确定。套路大概下面几个:1 在上下文搜搜相关参数是否存在,如果是服务器返回的,就直接请求服务器获得该参数;2 如果该参数很明显不变或者变化有规律,可以直接伪造;3 如果参数很复杂且没规律,那么需要搜索参数的key,找到加密的js,然后构造参数的值,得到ajax url;4 实在难度太大那么用selenium等自动化工具驱动浏览器来访问,它会直接给你渲染好所有js
标签:
java
相关文章:
1. css - 如何使用 vue transition 实现 ios 按钮一样的平滑切换效果2. angular.js - 关于$apply()3. mysql - 把一个表中的数据count更新到另一个表里?4. 网络传输协议 - 以下三种下载方式有什么不同?如何用python模拟下载器下载?5. mysql数据库做关联一般用id还是用户名6. 关于python切片的问题7. linux - 升级到Python3.6后GDB无法正常运行?8. mysql 里边,自增长id,写数据时,是先把数据写进去,然后再给这条数据一个id,还是先给id,然后再把要插入的数据写进去9. 多维数组如何在视图中渲染10. javascript - 前端怎样实现图片剪切一部分上传呢?像微信或者QQ上传那样呢?用的啥技术
排行榜
