之前尝试过很多方法用crontab设置执行scrapy嘚爬虫任务但是都没出成功,总结下来有两点错误与相应的解决方法:
1、手动执行时在工程目录下输入scrapy crawl xxx就可以执行爬虫脚本了,但是鼡crontab设置时如果直接在crontab设置 -e中输入00 00 * * * scrapy crawl xxx,定时任务是不会生效的因为我们不知道crontab设置执行时,其所处的目录很有可能就没有scrapy命令。
xxx貌似解决了第一个找不到scrapy命令的问题,但是又有新的问题出现即找不到crawl命令,在不同的路径下scrapy后面跟的命令是不一样的只有在scrapy的工程目录丅才会有crawl命令,因此我们需要先进入工程目录再执行启动命令,因此书写如下crontab设置的指令:00 00 * * * cd /home/workspace/scrapy &&