本人是刚刚接触爬虫的新手。
目标:抓取一个网站上公布的所有产品报价
操作流程:按照教学的步骤,在MS谋数台设定了规则和线索,点击“抓数据”后,DS打数机开始工作,存储的文件夹里陆续出现一个个XML文档,到此为止貌似一切顺利。
问题来了:在抓取工作进行了二十分钟后,发现打数机突然停止工作,日志里出现了下面的字:
再看存储文件的文件夹里,已经有了不少XML文档,用EXCEL导入之后可以看到部分抓取的信息。
然并卵,这不是我想要的。我想要全部,它只给了我局部。
另外,大家看看我线索统计,成功抓取率居然是0,但我明明已经抓大到了一部分啊。
实在搞不懂,请大神们指点,咱们也交个朋友。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2015-11-6 10:43