本帖最后由 gooseeker_info 于 2015-10-8 18:57 编辑

:抓取的时候遇到timeout to load the page怎么设置爬取的频率、
:出现timeout很可能是因为抓取规则不适合这个网页,也可以调整一下超时时间试试,在DS打数机的菜单中有“超时时长”这项。
MS谋数台上有个菜单“工具”-》“加载规则”-》“按线索号”,选一个timeout的线索号,加载上分析一下失败原因。


:那个“超时时长”参数设置要往小的方向设置吗

:2分钟足够了,还不够的话可能是规则有问题


举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-10-8 18:56

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:31