本帖最后由 wangyong 于 2021-9-27 11:34 编辑
问题描述:在当当图书评论页面抓取每一个评论者的数据,采集到了最后一页,所有数据均已成功采集,最后一页采集成功后,爬虫却显示采集失败。以下为附图
图1:图1为正常采集页面,已经采集到了40多页
图2: 图2为采集到了最后一页,所有采集均已完成,此时应该退出显示采集成功。但是并没有。发生了如下的情况
图3: 图3为最后一页,打数机又继续翻页,系统默认好评,此时已经没有任何数据,应该返回采集成功。 却返回了采集失败的消息。
图4:图4为查看的后续分析的失败原因。
最终得到的数据是所有评论的数据,但是却返回 采集失败。
由于要采集的图书有很多,所以如果返回采集失败的话,无从得知是 由于此原因失败,还是 由于网页结构不适用而失败
因此需要这种情况下返回成功,还望技术人员帮我解答这个问题。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 13 个关于本帖的回复 最后回复于 2021-9-27 11:30