文章详情页
python - 用scrapy-splash爬取网站 为啥iframe下的内容没有被返回
浏览:213日期:2022-08-10 09:23:22
问题描述
用scrapy-splash爬取网站 为啥iframe下的内容没有被返回?
import scrapyfrom scrapy import Selectorclass Music163Spider(scrapy.Spider): name = 'music163' allowed_domains = ['music.163.com/#/discover/toplist'] start_urls = [’http://music.163.com/#/discover/toplist/’] def parse(self, response):print('parse:',response.text) def start_requests(self):for url in self.start_urls: yield scrapy.Request(url, self.parse, meta={’splash’: { ’endpoint’: ’render.html’, ’args’: {’wait’: 0.5, }} })
问题解答
回答1:你需要在parse中获取iframe的url再次请求内容。
相关文章:
1. debian - docker依赖的aufs-tools源码哪里可以找到啊?2. dockerfile - 为什么docker容器启动不了?3. docker gitlab 如何git clone?4. docker - 各位电脑上有多少个容器啊?容器一多,自己都搞混了,咋办呢?5. javascript - 修改表单多选项时和后台同事配合的问题。6. nignx - docker内nginx 80端口被占用7. Python Selenium WebDriver如何刷新当前页面8. node.js - webpack required打包问题9. css - ul ol前边的标记如何调整样式呢10. 求大神指点js修改margintop导致无限下滑的问题
排行榜

网公网安备