本帖最后由 ym 于 2015-11-20 16:03 编辑

常见问题 > 制作规则—常见问题导航 > 采集多层级网页数据 > 抓第二级时,为什么会显示空白网页

现象:
做了两级抓取规则,当抓取第二级的时候,能从DS打数机的浏览器窗口看到空白页面,而且抓取失败。用MS谋数台加载失败线索进行检查的时候,也是空白页面。

原因分析:运行第一级的时候,抓到的网址可能是无效。这种情况有可能发生,比如,一个长网页上显示了大量图片,如果没有滚屏,未被显示出来的图片网址就可能是无效,必须设置滚屏抓取模式才能避免这个问题。
原因可能有多种,上面是一种,需要具体分析。


检查方法:把第一级抓取结果导入excel,进行排序或者筛选,看看是否有非法的网址

举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-10-22 16:00

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-29 19:22