|
已停止就是爬虫遇到问题了,没有运行到底。最可能的问题是:
1,DS打数机窗口在运行过程中不能缩小,更不能最小化,因为微博是动态内容,窗口不够大就不会显示。如果使用集搜客数据管家采集微博,也是一样的。窗口上面可以覆盖其他窗口,但是不能最小化
2,没有在集搜客浏览器或者数据管家浏览器中预先登录微博
3,网络不稳定,某条网址失败了。微博评论和转发特别容易出现这种问题
4,微博自己做了删评论工作,翻页到某一页后就看不到评论了,就会失败
还有可能爬虫规则不适合网页,失败了。
点击“已停止”按钮,应该能看到添加的网址,找到那条失败的,发出来我们看看。
|
|