文章详情页

编码 - Python 3.6中 ’utf-8’ codec can’t decode byte invalid start byte?

浏览：246日期：2022-09-01 10:28:08

问题描述

Python 3.6中，网页信息解析失败，试了很多种编码，查看网页的编码方式也是utf-8。错误信息：’utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte?还有就是第一个print终端里打印出来的unicode内容是[b’x1fx8bx08x00x...]这种格式的，之前也有过这种情况，一个print打2个变量，就是b’x, 如果分来2行打又变回了汉字。是因为什么原因呢？

# -*- coding: utf-8 -*-import json , sqlite3import urllib.requesturl = (’http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7’)resp = urllib.request.urlopen(url)content = resp.read()print(content)print(type(content))print(content.decode(’utf-8’))

问题解答

回答1：

编码 - Python 3.6中 ’utf-8’ codec can’t decode byte invalid start byte?

看了一下网站返回的是gzip压缩过的数据，所以要进行解码

# coding=utf-8from io import BytesIOimport gzipimport urllib.requesturl = (’http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7’)resp = urllib.request.urlopen(url)content = resp.read() # content是压缩过的数据buff = BytesIO(content) # 把content转为文件对象f = gzip.GzipFile(fileobj=buff)res = f.read().decode(’utf-8’)print(res)

编码 - Python 3.6中 ’utf-8’ codec can’t decode byte invalid start byte?

回答2：

requests不好用吗？

回答3：

编码 - Python 3.6中 ’utf-8’ codec can’t decode byte invalid start byte?

建议用requeset，代码如下：

import requestsr = requests.get(’http://wthrcdn.etouch.cn/weather_mini?city=%E4%B8%8A%E6%B5%B7’)print(r.text)回答4：

不是字符编码问题, 你看看你请求的 Respont headers

Status Code: 200 OK Access-Control-Allow-Headers: * Access-Control-Allow-Methods: * Access-Control-Allow-Origin: * Cache-Control: must-revalidate, max-age=300 Connection: Keep-Alive Content-Encoding: gzip Content-Length: 443 Date: Fri, 10 Mar 2017 03:20:46 GMT Fw-Cache-Status: hit Fw-Via: HTTP MISS from 58.59.19.99, DISK HIT from 183.131.161.27 Server: Tengine/2.1.2

是gzip, 如果用标准库的东西, 还需要把gzip 给解开

Python 编程

上一条：网页爬虫 - 关于python3.x 编写爬虫异常问题请各位大神帮忙！下一条：mysql - python如何给微信小程序写后台？

相关文章：

1. docker容器呢SSH为什么连不通呢？2. Docker for Mac 创建的dnsmasq容器连不上/不工作的问题3. golang - 用IDE看docker源码时的小问题4. docker images显示的镜像过多，狗眼被亮瞎了，怎么办？5. docker start -a dockername 老是卡住，什么情况？6. Hbuilder中的phpMyAdmin访问题7. 前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~8. 如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？9. docker api 开发的端口怎么获取？10. javascript - 关于用户登录和信息存储的问题

排行榜

					
					Docker for Mac 创建的dnsmasq容器连不上/不工作的问题
docker容器呢SSH为什么连不通呢？
golang - 用IDE看docker源码时的小问题
docker api 开发的端口怎么获取？
docker start -a dockername 老是卡住，什么情况？
docker images显示的镜像过多，狗眼被亮瞎了，怎么办？
前端 - 类到底该如何去命名 .newsList 这种的命名难道真的不是过度语义化吗？~
Hbuilder中的phpMyAdmin访问题
如何解决Centos下Docker服务启动无响应，且输入docker命令无响应？
angular.js - angular中的a标签不起作用
取不出SQL得到的当前页
				

热门标签