文章详情页
python - 关于beautifulsoup获取文档内容
浏览:202日期:2022-06-28 08:25:17
问题描述
获取到的资料保存到了本地端打算用beautifulsoup解析资料,如图:
<p><strong>释名</strong><br/>人龙。</p><p><strong>气味</strong><br/>大寒。</p><p><strong>主治</strong><br/>多年风眼。用蛔虫五条,晒干,研为末,加腻粉一钱、石胆半钱,共研为末点眼。每日二、三次。<br/>一切冷瘘。和人吐蛔虫烧灰涂搽。涂前以甘草汤洗净患处。<br/>小儿赤眼(胎赤眼或风赤眼)。用小儿吐出的蛔虫二长,装磁盒中,纸封好,埋湿地内。过五天取出,收存汁水。每日以箸蘸汁点眼。此方名“玉箸煎”。</p>
我的代码如下:
for i in soup.find_all(’strong’): print(i.string)
但是输出是:释名气味主治
而这几个所跟着的内容却没有输出,我知道是我的代码问题,但是又不知道怎么解决。另外,我想问用beautifulsoup是不是不能解析保存下来的文字档,我看网上的教程都是在源代码上摘取标签从而获得想要的内容。
问题解答
回答1:因为你查找的部分是strong标签(soup.find_all(’strong’)),所以没有加重标签的部分就不会被遍历到啊,其中只有释名 气味 主治是有strong标签的。
相关文章:
1. debian - docker依赖的aufs-tools源码哪里可以找到啊?2. docker gitlab 如何git clone?3. dockerfile - 为什么docker容器启动不了?4. docker - 各位电脑上有多少个容器啊?容器一多,自己都搞混了,咋办呢?5. nignx - docker内nginx 80端口被占用6. javascript - 修改表单多选项时和后台同事配合的问题。7. Python Selenium WebDriver如何刷新当前页面8. node.js - webpack required打包问题9. 为什么要使用javascript函数包装器(添加在coffeescript中)“。call(this)”10. css - ul ol前边的标记如何调整样式呢
排行榜

网公网安备