文章详情页

python - pythoh3 下 ’<abc>’ 遇到这样的html转义符如何自动转义呢？

浏览：213日期：2022-06-28 18:47:10

问题描述

初学python，在使用scray 爬虫时，遇到html的特殊字符，于是百度搜看了下文档：

import HTMLParser html_parser = HTMLParser.HTMLParser() s = ’&l t;abc&g t;&nbs p;’ #避免网页转义留了个空格s = html_parser.unescape(s)

运行时提示：import markupbaseImportError: No module named ’markupbase’

借助翻译软件，看HTMLParser官方文档找了第二种方法

from html.parser import HTMLParser

class MyHTMLParser(HTMLParser):

def handle_data(self, data): print(data) return data

parser = MyHTMLParser()s = ’&l t;abc&g t;&nbs p;’ #避免网页转义留了个空格ss=parser.feed(s)

第二种方法测试成功，遇到的问题是，return data 这一句，返回数据是无效的？

请问，有没有就几句代码解决转义的，如果没有第二种方法里如何才有返回值？

问题解答

回答1：

from html.parser import HTMLParserhtml_parser = HTMLParser()s = ’<abc> ’txt = html_parser.unescape(s)print(txt)# 结果：<abc>

Python 编程

上一条：python - Django中如何使用异步下一条：python - ubuntu16.04 lxml的报错

相关文章：

1. golang - 用IDE看docker源码时的小问题2. 请问“由于 Cookie “PHPSESSID”的“SameSite”属性设置为“None”，但缺少“Secure”属性，此 Cookie 未来将被拒绝。”请问出现这个问题怎么办？3. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题4. 前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~5. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？6. docker start -a dockername 老是卡住，什么情况？7. docker api 开发的端口怎么获取？8. docker容器呢SSH为什么连不通呢？9. 如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？10. python小白，关于函数问题

排行榜

					
					Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
docker容器呢SSH为什么连不通呢？
golang - 用IDE看docker源码时的小问题
docker api 开发的端口怎么获取？
docker start -a dockername 老是卡住，什么情况？
请问“由于 Cookie “PHPSESSID”的“SameSite”属性设置为“None”，但缺少“Secure”属性，此 Cookie 未来将被拒绝。”请问出现这个问题怎么办？
docker images显示的镜像过多，狗眼被亮瞎了，怎么办？
前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~
如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？
angular.js - angular中的a标签不起作用
取不出SQL得到的当前页
				

热门标签

python - pythoh3 下 ’&lt;abc&gt;’ 遇到这样的html转义符如何自动转义呢？

python - pythoh3 下 ’<abc>’ 遇到这样的html转义符如何自动转义呢？