文章详情页
python - scrapy 处理 文章 分页的内容
浏览:194日期:2022-08-03 16:15:10
问题描述
如一篇文章有2-3页,然后想把这些内容页爬下来,拼接成一页,然后再放入数据库。文章url如:article_1.html,article_2.htmlitem有:item[’title’],item[’content’]而item[’content’]就是拼接成一页的内容。大概怎么写呢?
问题解答
回答1:找到分页接口url
回答2:找到那个下一页的链接,加入到爬取url列表中
回答3:可以在rules里面写正则自动扫描符合的url
相关文章:
1. redis sentinel怎么跑守护进程以及日志记录位置的?2. python 字符串匹配问题3. 请问PHPstudy中的数据库如何创建索引4. django - Nginx uwsgi 进程问题5. javascript - sublime快键键问题6. 使用git管理webpack的代码时多人怎么协作?一般托管哪些文件?7. html - angular项目中如何让外链网页在本项目中展示?8. Python异常退出时保存进度?9. 前端 - 这段代码一直生效不了,查半天因为 top: 0px; 分号后一个隐藏的东西,也不是占位符...删了就可以生效,这是什么情况。。10. 这是什么情况???
排行榜

网公网安备