文章详情页
python - 把<dl></dl>标签包含进去如何拿到我想要的内容
浏览:163日期:2022-07-21 08:07:19
问题描述
1.我把<dl>标签加进去拿到的是空内容,我该怎么写匹配规则,不加<dl>标签倒是可以拿到想要的内容2.问题代码
pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>标签加进去可以拿到想要的内容
4.附上网页源代码
<dl><dt>《明末工程师》正文</dt><dd><a href='https://www.haobala.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
问题解答
回答1:# 你可能需要加个模式# re.S 使 . 匹配包括换行在内的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要转义下<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相关文章:
1. 修改mysql配置文件的默认字符集重启后依然不生效2. javascript - 正则匹配字符串特定语句后的数字3. 老师,你这两条斜杠的是怎么注释的?4. java - mybatis源码分析5. css - html根字体设置成很大的值后, 包裹了行内元素的div莫名变高是什么原因6. 请教一个python字符串处理的问题?7. python - scrapy 处理 文章 分页的内容8. java - servlet的init方法和选择Filter的init方法来加载配置文件,二者有何区别?9. javascript - 一个前端的自我修养10. javascript - main head .intro-text{width:40%} main head{display:flex}为何无效?
排行榜

网公网安备