文章详情页
python - 把<dl></dl>标签包含进去如何拿到我想要的内容
浏览:153日期:2022-07-21 08:07:19
问题描述
1.我把<dl>标签加进去拿到的是空内容,我该怎么写匹配规则,不加<dl>标签倒是可以拿到想要的内容2.问题代码
pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>标签加进去可以拿到想要的内容
4.附上网页源代码
<dl><dt>《明末工程师》正文</dt><dd><a href='https://www.haobala.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
问题解答
回答1:# 你可能需要加个模式# re.S 使 . 匹配包括换行在内的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要转义下<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相关文章:
1. android - Manifest.xml自己生成的GMS服务怎么删掉呢?2. java - git项目迁移到SVN怎么实现的?哪位大神指点指点3. css - 手机app中rem的基准值计算错误4. php如何单独提取出不满足条件的字符串5. 绘制图表的问题6. ThinkPHP5实战之教学系统7. 为什么要通过常量的方式拐弯抹角的写呢,直接写DSN之类的不好吗8. 关于thinkphp 5.1中,ajax提交数据url的格式写法,加花括号就出错,请老师指点9. 大佬们,这个连接数据库的哪里错了,登录后台进不去10. 站点内容复制额外增加的版权申明,真的很反人类。试问产品自己在用这个站点吗?
排行榜

网公网安备