文章详情页
python - scrapy 再次请求的问题
浏览:178日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. javascript - 给某个类添加一个伪类,这个类有click事件,现在我点击伪类也触发了click事件2. angular.js - angular内容过长展开收起效果3. docker绑定了nginx端口 外部访问不到4. docker images显示的镜像过多,狗眼被亮瞎了,怎么办?5. docker gitlab 如何git clone?6. 小白学python的问题 关于%d和%s的区别7. angular.js - 怎样实现点击 “分数” 后按分数升序和降序排列?8. css - 如何更改 iOS 和安卓浏览器上的 input[type="radio"] 元素的默认样式?9. javascript - 这是什么数组?10. javascript - 怎样去除数组里的几个值,只提供该数组的下标的话
排行榜

网公网安备