文章详情页

python - ulipad爬网页时中文为何是16进制？

浏览：232日期：2022-08-15 18:33:50

问题描述

#! /usr/bin/env python#coding=utf-8import urlliburl = 'http://www.tust.edu.cn'content = urllib.urlopen(url).read()print content

python初学者，也是编程初学者。上面是代码，用python2.7编译的时候网页上的中文可以正常显示，但是用ulipad编译的时候，网页中的文字就是以16进制的方式显示的。请问这个是什么问题？

我搜索的时候，看到有的回答说是在代码后面加上encode

然而我在content后面接encode(’utf-8’)或者encode(’gb2312’)的时候都会提示报错

ascii codec can’t decode byte 0Xef in position 0:ordinal not in range

我查了一下，找到了下面这个网址

http://blog.csdn.net/qian_f/a...

好像是说是字符编码不统一的问题。紧接着我查了一下read返回的好像就是byte string呀....

求各位大神解答...

问题解答

回答1：

个人理解，应该是read()默认的编码无法解析网页内容，查下资料，尝试在read的括号内指定编码，应该没有必要用encode的

回答2：

unicode.encode(content,’utf-8’);

Python 编程

上一条：mysql for python安装不上，总是显示需要python2.7版本，可是本机版本就是2.7下一条：python怎么使用matplotlib画出下面这样的图？

相关文章：

1. 关于docker下的nginx压力测试2. docker-compose中volumes的问题3. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题4. javascript - vue的element-ui(饿了吗UI) webpack打包时externals无法分离5. 前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~6. docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？7. 如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？8. docker gitlab 如何git clone？9. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？10. dockerfile - [docker build image失败- npm install]

排行榜

					
					关于docker下的nginx压力测试
Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
docker-compose中volumes的问题
javascript - vue的element-ui(饿了吗UI) webpack打包时externals无法分离
docker - 各位电脑上有多少个容器啊？容器一多，自己都搞混了，咋办呢？
docker gitlab 如何git clone？
docker images显示的镜像过多，狗眼被亮瞎了，怎么办？
前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~
如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？
Android "1"=="1" 到底是true还是false
docker容器呢SSH为什么连不通呢？
				

热门标签