21#
y369654863 新手上路 发表于 2018-7-3 15:54:22 | 只看该作者
我现在只√了评价内容做关键内容,它不会爬到最后那三项都没有了,只剩内容了吧
举报 使用道具
22#
wangyong 版主 发表于 2018-7-3 16:01:42 | 只看该作者
采集的时候打开滚屏,如果网页上有其他三项内容就会采集下来,没有的话就会保存为空不会报错
举报 使用道具
23#
y369654863 新手上路 发表于 2018-7-3 16:31:03 | 只看该作者
wangyong 发表于 2018-7-3 16:01
采集的时候打开滚屏,如果网页上有其他三项内容就会采集下来,没有的话就会保存为空不会报错 ...

还是断了,一共102页80页的时候断了,滚屏一直开着的,因为我过一会就会看它爬到多少页
举报 使用道具
24#
bowieD 金牌会员 发表于 2018-7-4 09:55:00 | 只看该作者
y369654863 发表于 2018-7-3 16:31
还是断了,一共102页80页的时候断了,滚屏一直开着的,因为我过一会就会看它爬到多少页
...

第80页断了,没有报错的话应该不是规则问题,而是跟网速等因素有关,可以重新启动采集,手动跳转到第80页继续采集80页之后的
举报 使用道具
25#
y369654863 新手上路 发表于 2018-7-5 10:41:14 | 只看该作者
bowieD 发表于 2018-7-4 09:55
第80页断了,没有报错的话应该不是规则问题,而是跟网速等因素有关,可以重新启动采集,手动跳转到第80页 ...

报错了,抓取失败还是老问题

举报 使用道具
26#
bowieD 金牌会员 发表于 2018-7-5 10:52:57 | 只看该作者
用规则去加载报错的页面,看规则是哪里不适应,再修改规则,可以参考这个教程《抓取失败(超时),抓取规则不合适或者超时时间设置太短》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 18:21