文章详情页
python - 把<dl></dl>标签包含进去如何拿到我想要的内容
浏览:98日期:2022-07-21 08:07:19
问题描述
1.我把<dl>标签加进去拿到的是空内容,我该怎么写匹配规则,不加<dl>标签倒是可以拿到想要的内容2.问题代码
pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>标签加进去可以拿到想要的内容
4.附上网页源代码
<dl><dt>《明末工程师》正文</dt><dd><a href='https://www.haobala.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
问题解答
回答1:# 你可能需要加个模式# re.S 使 . 匹配包括换行在内的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要转义下<dl>.*?<dd><a href='https://www.haobala.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相关文章:
1. MySQL客户端吃掉了SQL注解?2. 网页爬虫 - python爬虫翻页问题,请问各位大神我这段代码怎样翻页,还有价格要登陆后才能看到,应该怎么解决3. javascript - 图片能在网站显示,但控制台仍旧报错403 (Forbidden)4. mysql - AttributeError: ’module’ object has no attribute ’MatchType’5. 数据库 - MySQL 单表500W+数据,查询超时,如何优化呢?6. android - Windows系统下运行react-native App时,报下面的错误?7. php自学从哪里开始?8. 求大神帮我看看是哪里写错了 感谢细心解答9. phpstady在win10上运行10. objective-c - iOS怎么实现像QQ或者微信的实时推送
排行榜
