python - Scrapy中xpath用到中文报错
问题描述
问题描述links = sel.xpath(’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
报错:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
问题解答
回答1:参见文章:解决Scrapy中xpath用到中文报错问题
解决方法方法一:将整个xpath语句转成Unicode
links = sel.xpath(u’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
方法二:xpath语句用已转成Unicode的title变量
title = u'置顶'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()
方法三:直接用xpath中变量语法($符号加变量名)$title, 传参title即可
links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2:
整个字符串前加个u试试
相关文章:
1. css - 如何使用 vue transition 实现 ios 按钮一样的平滑切换效果2. angular.js - 关于$apply()3. mysql - 把一个表中的数据count更新到另一个表里?4. 网络传输协议 - 以下三种下载方式有什么不同?如何用python模拟下载器下载?5. mysql数据库做关联一般用id还是用户名6. 关于python切片的问题7. linux - 升级到Python3.6后GDB无法正常运行?8. mysql 里边,自增长id,写数据时,是先把数据写进去,然后再给这条数据一个id,还是先给id,然后再把要插入的数据写进去9. 多维数组如何在视图中渲染10. javascript - 前端怎样实现图片剪切一部分上传呢?像微信或者QQ上传那样呢?用的啥技术
