11#
Fuller 管理员 发表于 2019-7-26 15:43:41 | 只看该作者
holamonica 发表于 2019-7-26 15:35
那一般超时时长最多可以设多少在不影响爬取速度的情况下?

一般60秒就够了,如果网页加载特别慢,可以根据情况把这个数字再提高,但是我觉得再高的话,就会网络问题了,即使能勉强爬到,也太慢了,一小时爬不了几个网页。如果是外网,可以用vpn提高速度
举报 使用道具
12#
holamonica 初级会员 发表于 2019-7-26 16:03:21 | 只看该作者
好的,谢谢您  ! 那我失败的那些都是集搜窗口一片空白,然后在验证规则的过程中就失败了,您觉得这可能是什么原因?
举报 使用道具
13#
Fuller 管理员 发表于 2019-7-26 16:07:08 | 只看该作者
holamonica 发表于 2019-7-26 16:03
好的,谢谢您  ! 那我失败的那些都是集搜窗口一片空白,然后在验证规则的过程中就失败了,您觉得这可能是 ...

失败以后,在DS打数机窗口下部的日志窗口中能看到一条日志,显示了线索号,按照这个帖子可以加载和分析失败线索:https://www.gooseeker.com/doc/thread-13085-1-1.html

看看加载成什么样子,会不会所用的网址本身就是错误的
举报 使用道具
14#
holamonica 初级会员 发表于 2019-7-26 16:14:16 | 只看该作者
Fuller 发表于 2019-7-26 16:07
失败以后,在DS打数机窗口下部的日志窗口中能看到一条日志,显示了线索号,按照这个帖子可以加载和分析失 ...

我前边改过,但是我要改的有点多,哈哈哈 ,等我跑完改改试试 有问题再请教您
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 15:27