文章详情页
网页爬虫 - 关于python beautifullsoup解析网页内容丢失的问题?
浏览:107日期:2022-09-23 08:23:07
问题描述
待解析页面的部分代码如第一幅图所示,我自己写的代码及运行结果如第二幅图所示。看到已经有答主提问解析页面丢失是因为用的是lxml的解析方式,我想说我一直用的是html.parser的方式。希望各位大神不吝赐教~
问题解答
回答1:你们从来都不考虑javascript动态加载的吗?
回答2:题主,如果你用Chrome F12看的话,里面是会有动态加载的内容的,而这些内容你直接请求页面的url是拿不到的。建议你点右键查看网页源代码,对照着F12里面的内容来看,源代码里没有的内容,就去查看Network里的其他请求,看有没有你需要的数据。
相关文章:
1. html5 - 自己的H5页面如何集成支付宝支付2. python - beautifulsoup获取网页内容的问题3. Python爬虫如何爬取span和span中间的内容并分别存入字典里?4. mysql优化 - 关于mysql分区5. python - 能通过CAN控制一部普通的家用轿车吗?6. 人工智能 - python 机器学习 医疗数据 怎么学7. centos7 编译安装 Python 3.5.1 失败8. mysql - 分库分表、分区、读写分离 这些都是用在什么场景下 ,会带来哪些效率或者其他方面的好处9. python - Django内使用filter过滤时间,只认年份不认月份是怎么回事?10. c++ - 请问MySQL_Connection::isReadOnly 怎么解决?
排行榜
