|
单搜爬取,我们测试任务1也是正常的(一般也是先各单任务测试,单任务正常后,再加入爬虫群进行任务串联),是因为没有调动任务2进行采集。单个的任务1启动,无法得到最终的需要数据(任务2采集的数据才是最终需要的,其他的都是中间数据)。
爬虫群模式下,任务1弹出新链接界面后,随后会接着调动任务2进行数据采集,1个链接采集完后,任务就会出现“结束状态”窗口,这样就会随着任务1调动的新链接界面越来越多,就会出现无数的“结束状态”窗口,最终电脑会死机。
期望的正常状态应为:在爬虫群模式下,窗口状态应以现有单搜的这种工作窗口切换状态进行工作(即:弹出新链接1,数据1采集完,新链接1关闭,弹出新链接2,数据2采集完,新链接2关闭,不停循环,直至没有新链接),完成任务执行,得到最终数据。
|
|