一直都是”待采集“状态(已在cooseeker登录知乎),尝试其他网站的采集也是待采集状态。注册了别的号,出现”采集中“状态,但是会出现错误。是怎么回事?

举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2020-4-14 23:09

沙发
maohui 中级会员 发表于 2019-1-2 21:37:03 | 只看该作者
绝大多少原因是你登录会员中心(网页上的)用的账号和登录爬虫客户端的账号不一样。

你可以在爬虫客户端上用菜单 配置-》账号管理 ,看看账号是不是对不上。

如果账号是对上的,那就可能是爬虫客户端没有连上服务器,那么用菜单 配置-》账号管理,在弹出窗口中点击 重选服务器 按钮,输入服务器地址 https://www.gooseeker.com  ,注意要用https,不是http,有些校园网会劫持http
举报 使用道具
板凳
ritachen 初级会员 发表于 2019-1-3 18:55:28 | 只看该作者
谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适或者超时时间设置太短”和“没有线索了,可添加新线索或者激活已有的线索。”

你说的最后连上服务器我没有找到。
举报 使用道具
地板
ritachen 初级会员 发表于 2019-1-3 18:55:49 | 只看该作者
maohui 发表于 2019-1-2 21:37
绝大多少原因是你登录会员中心(网页上的)用的账号和登录爬虫客户端的账号不一样。

你可以在爬虫客户端上 ...

谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适或者超时时间设置太短”和“没有线索了,可添加新线索或者激活已有的线索。”

你说的最后连上服务器我没有找到。
举报 使用道具
5#
Fuller 管理员 发表于 2019-1-3 19:19:36 | 只看该作者
ritachen 发表于 2019-1-3 18:55
谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适 ...

如果显示
  1. 没有线索了,可添加新线索或者激活已有的线索
复制代码
表示你添加的网址都采集完了,不一定成功了,反正是采集了一遍,如果还要采集,就要再次加网址了

如果显示
  1. 抓取失败(超时),抓取规则不合适或者超时时间设置太短
复制代码
表示用这个抓取工具抓不了这条网址。可能有多个原因:
1,我们针对每一类知乎网页做了对应的规则,比如,知乎_独立话题动态内容采集 这个就不能采集关键词搜索。那么要检查添加的网址是不是不符合
2,也可能是我们的抓取工具适应性不够,不适应您的网址,请把网址贴出来,我们检查一下






举报 使用道具
6#
ritachen 初级会员 发表于 2019-1-3 20:29:29 | 只看该作者
Fuller 发表于 2019-1-3 19:19
如果显示  表示你添加的网址都采集完了,不一定成功了,反正是采集了一遍,如果还要采集,就要再次加网址 ...

https://www.zhihu.com/topic/19563759/hot
我填的知乎独立话题动态内容采集,选择全部。


举报 使用道具
7#
Fuller 管理员 发表于 2019-1-3 21:03:09 | 只看该作者
ritachen 发表于 2019-1-3 20:29
https://www.zhihu.com/topic/19563759/hot
我填的知乎独立话题动态内容采集,选择全部。

这个规则需要修改了,我安排了人赶快修改一下这个规则,修改好以后会在这里留言通知大家
举报 使用道具
8#
ritachen 初级会员 发表于 2019-1-3 21:18:51 | 只看该作者
Fuller 发表于 2019-1-3 21:03
这个规则需要修改了,我安排了人赶快修改一下这个规则,修改好以后会在这里留言通知大家
...

谢谢了!作为一个文科生差点怀疑了我的智商

希望快一点啊,全网找了你们的最合适了

举报 使用道具
9#
Fuller 管理员 发表于 2019-1-4 10:14:49 | 只看该作者
ritachen 发表于 2019-1-3 21:18
谢谢了!作为一个文科生差点怀疑了我的智商

希望快一点啊,全网找了你们的最合适了

修改完成,可以用了
举报 使用道具
10#
ritachen 初级会员 发表于 2019-1-4 21:42:29 | 只看该作者
Fuller 发表于 2019-1-4 10:14
修改完成,可以用了

试了三次,确实采集了很长时间,但是最后采到的只有2条,可是问题有3000多条呢?最后都说脚本错误。捉急……



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-23 06:42