文章详情页
python - scrapy 再次请求的问题
浏览:161日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. docker start -a dockername 老是卡住,什么情况?2. python运行后没有任何反馈要怎么排查3. java内存模型的happens-before语义顺序问题4. java - 配置tomcat免安装版,无法启动 返回错误码45. html5 - 现在做了个宣传用的H5需要获取openid6. javascript - QQ自带浏览器中,点击返回,就刷新页面,关闭按钮不出现,有没有人知道是怎么回事???7. Mysql 关于 FOUND_ROWS() 和 ROW_COUNT() 函数8. logging - Python日志, 时间应该使用UTC时间还是本地时间?9. 请问下在VueJS中v-for 怎么拿到循环次数的变量呢?10. javascript - webpack build出错后如何定位文件?
排行榜
