文章详情页
python - pyspider 定时爬取问题
浏览:207日期:2022-07-14 10:37:31
问题描述



在写爬虫的时候,发现 在代码中设置了 every 之后,21号爬取了一次之后,今天看 result 没有更新,那个 lastcrawltime 依旧是 21号的。请问是不是我的参数设置的不正确?




问题解答
回答1:你贴的这个 task 的图,是什么任务的?
贴的是 detail_page 的任务的
题主给 index_page 设置了小于 cronjob 间隔的时间。然而没有给 detail_page 设置。这样 detail_page 是不会被重新调度的
project 队列状态,最近活动任务是怎样的?
回答2:有可能是 every 和 age 不匹配。如果 age 没问题的话,说实话这属于疑难杂症了,我也经常遇到,我都是去 taskdb 把相应的表清空,然后重启 pyspider 重新运行项目
相关文章:
1. javascript - 修改表单多选项时和后台同事配合的问题。2. docker绑定了nginx端口 外部访问不到3. dockerfile - [docker build image失败- npm install]4. javascript - 怎么实现点击表格中的某一行然后就在表单处出现表格中的对应的属性值啊5. redis - 究竟是选择微信小程序自带的统计工具还是自己开发一个数据统计的代码?6. 关于docker下的nginx压力测试7. angular.js - angular ui bootstrap 中文显示问题8. angular.js使用$resource服务把数据存入mongodb的问题。9. macos - mac下docker如何设置代理10. javascript - react-router 4.0版本怎么实现以前onEnter的效果
排行榜

网公网安备