文章详情页

python - scrapy 处理文章分页的内容

浏览：227日期：2022-08-03 16:15:10

问题描述

如一篇文章有2-3页，然后想把这些内容页爬下来，拼接成一页，然后再放入数据库。文章url如：article_1.html,article_2.htmlitem有：item[’title’],item[’content’]而item[’content’]就是拼接成一页的内容。大概怎么写呢？

问题解答

回答1：

找到分页接口url

回答2：

找到那个下一页的链接，加入到爬取url列表中

回答3：

可以在rules里面写正则自动扫描符合的url

Python 编程

上一条：python - 如何让dataframe A 的一列与dataframe B的一列相减相加结果记到A的c列？下一条：乱码 - VS2013+PTVS，python编码问题

相关文章：

1. mysql如何配置远程php外网链接数据库2. 如何解决tp6在zend中无代码提示3. mysql多表查询4. 微信端电子书翻页效果5. node.js - win10如何安装并使用babel？6. MYSQL 运算的问题7. html5 - 用h5本地存储是否安全？8. css3 - 微信前端页面遇到的transition过渡动画的bug9. MySQL分表之后如何做排序的问题10. 在别的电脑使用JDBC连接其他电脑上安装的mysql数据库

python - scrapy 处理 文章 分页的内容

python - scrapy 处理文章分页的内容