python - Scrapy中xpath用到中文报错
问题描述
问题描述links = sel.xpath(’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
报错:ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
问题解答
回答1:参见文章:解决Scrapy中xpath用到中文报错问题
解决方法方法一:将整个xpath语句转成Unicode
links = sel.xpath(u’//i[contains(@title,'置顶')]/following-sibling::a/@href’).extract()
方法二:xpath语句用已转成Unicode的title变量
title = u'置顶'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()
方法三:直接用xpath中变量语法($符号加变量名)$title, 传参title即可
links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2:
整个字符串前加个u试试
相关文章:
1. css - 图片的宽度发生变化而高度却没有相应变?2. python for循环中的函数只能运行一次?3. dockerfile - 为什么docker容器启动不了?4. web服务器 - ubuntu下布置apache加wsgi加python5. docker 17.03 怎么配置 registry mirror ?6. css3 - 背景图自定义比例缩小7. tp6 事务闭包操作问题8. javascript - sublime快键键问题9. javascript - 微信小程序 如何实现这种左滑动出现删除的办法?有相关api吗?10. 主从复制 - MySQL 主从延迟 300s 以上,求大神解答

网公网安备