文章详情页
python - scrapy 再次请求的问题
浏览:143日期:2022-08-17 18:54:48
问题描述
如:item[’url’]=response.xpath(’a/@href’)分析出一个链接,然后想从这个链接里的网页再获取一些元素,放入item[’other’]。应该怎么写,谢谢。
问题解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文档https://doc.scrapy.org/en/lat...中文翻译版http://scrapy-chs.readthedocs...
相关文章:
1. html - 移动端radio无法选中2. css - 关于伪类背景问题3. html5 - vue 里的Elemen UI的时间怎么转化为时间戳吗4. html5 - 如何实现图中的刻度渐变效果?5. javascript - history.replaceState()无法改变query参数6. css - 怎么实现一个圆点在一个范围内乱飞7. javascript - 有什么工具可以自动给css3的样式 加 前缀 要最简单的 不会sass less8. 前端 - html5 audio不能播放9. html5 - 如何解决bootstrap打开模态modal窗口引起页面抖动?10. javascript - 图片请求失败怎么去掉左上角的小图标?
排行榜
