python - Scrapy中xpath用到中文报错
问题描述
问题描述links = sel.xpath(’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
报错:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
问题解答
回答1:参见文章:解决Scrapy中xpath用到中文报错问题
解决方法方法一:将整个xpath语句转成Unicode
links = sel.xpath(u’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
方法二:xpath语句用已转成Unicode的title变量
title = u'置顶'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()
方法三:直接用xpath中变量语法($符号加变量名)$title, 传参title即可
links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2:
整个字符串前加个u试试
相关文章:
1. javascript - Ajax返回json格式之后的数据解析后取出来的数据为undefined?2. css3 - 微信前端页面遇到的transition过渡动画的bug3. php - 微信开发验证服务器有效性4. python如何设置一个随着系统时间变化的动态变量?5. 个人主页博客统计中的“进入博客”不能点击6. Browser-sync安装失败问题7. sublime text 3不支持python的input吗8. javascript - jquery选择的dom元素如何更新?9. javascript - Webapp 关闭后重新打开无需登录如何操作?10. 网页爬虫 - 关于Python的编码与解码问题

网公网安备