python - Scrapy中xpath用到中文报错
问题描述
问题描述links = sel.xpath(’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
报错:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
问题解答
回答1:参见文章:解决Scrapy中xpath用到中文报错问题
解决方法方法一:将整个xpath语句转成Unicode
links = sel.xpath(u’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
方法二:xpath语句用已转成Unicode的title变量
title = u'置顶'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()
方法三:直接用xpath中变量语法($符号加变量名)$title, 传参title即可
links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2:
整个字符串前加个u试试
相关文章:
1. python - 求一个在def中可以实现调用本def满足特定条件continue效果的方法(标题说不太清楚,请见题内描述)2. mysql - SQL操作时间的函数?3. MYSQL新建用户设置可以远程访问的问题4. javascript - 用表单提交两个时间段请求后台返回对应数据时出现的一些问题!5. angular.js - angularjs的自定义过滤器如何给文字加颜色?6. java - mybatis怎么实现在数据库中有就修改,没有就添加7. javascript - ionic run android报错8. node.js - nodejs和前端JavaScript 字符串处理结果不一样是什么原因?9. 正则表达式 - python pandas的sep参数问题10. docker内创建jenkins访问另一个容器下的服务器问题
