一直都是”待采集“状态(已在cooseeker登录知乎),尝试其他网站的采集也是待采集状态。注册了别的号,出现”采集中“状态,但是会出现错误。是怎么回事?

举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2020-4-14 23:09

maohui 中级会员 发表于 2019-1-2 21:37:03 | 显示全部楼层
绝大多少原因是你登录会员中心(网页上的)用的账号和登录爬虫客户端的账号不一样。

你可以在爬虫客户端上用菜单 配置-》账号管理 ,看看账号是不是对不上。

如果账号是对上的,那就可能是爬虫客户端没有连上服务器,那么用菜单 配置-》账号管理,在弹出窗口中点击 重选服务器 按钮,输入服务器地址 https://www.gooseeker.com  ,注意要用https,不是http,有些校园网会劫持http
举报 使用道具
ritachen 初级会员 发表于 2019-1-3 18:55:28 | 显示全部楼层
谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适或者超时时间设置太短”和“没有线索了,可添加新线索或者激活已有的线索。”

你说的最后连上服务器我没有找到。
举报 使用道具
ritachen 初级会员 发表于 2019-1-3 18:55:49 | 显示全部楼层
maohui 发表于 2019-1-2 21:37
绝大多少原因是你登录会员中心(网页上的)用的账号和登录爬虫客户端的账号不一样。

你可以在爬虫客户端上 ...

谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适或者超时时间设置太短”和“没有线索了,可添加新线索或者激活已有的线索。”

你说的最后连上服务器我没有找到。
举报 使用道具
Fuller 管理员 发表于 2019-1-3 19:19:36 | 显示全部楼层
ritachen 发表于 2019-1-3 18:55
谢谢!

确实账户不一致,改了之后采集不一会儿就出现抓取错误,说是“抓取失败(超时),抓取规则不合适 ...

如果显示
  1. 没有线索了,可添加新线索或者激活已有的线索
复制代码
表示你添加的网址都采集完了,不一定成功了,反正是采集了一遍,如果还要采集,就要再次加网址了

如果显示
  1. 抓取失败(超时),抓取规则不合适或者超时时间设置太短
复制代码
表示用这个抓取工具抓不了这条网址。可能有多个原因:
1,我们针对每一类知乎网页做了对应的规则,比如,知乎_独立话题动态内容采集 这个就不能采集关键词搜索。那么要检查添加的网址是不是不符合
2,也可能是我们的抓取工具适应性不够,不适应您的网址,请把网址贴出来,我们检查一下






举报 使用道具
ritachen 初级会员 发表于 2019-1-3 20:29:29 | 显示全部楼层
Fuller 发表于 2019-1-3 19:19
如果显示  表示你添加的网址都采集完了,不一定成功了,反正是采集了一遍,如果还要采集,就要再次加网址 ...

https://www.zhihu.com/topic/19563759/hot
我填的知乎独立话题动态内容采集,选择全部。
问题.jpg

举报 使用道具
Fuller 管理员 发表于 2019-1-3 21:03:09 | 显示全部楼层
ritachen 发表于 2019-1-3 20:29
https://www.zhihu.com/topic/19563759/hot
我填的知乎独立话题动态内容采集,选择全部。

这个规则需要修改了,我安排了人赶快修改一下这个规则,修改好以后会在这里留言通知大家
举报 使用道具
ritachen 初级会员 发表于 2019-1-3 21:18:51 | 显示全部楼层
Fuller 发表于 2019-1-3 21:03
这个规则需要修改了,我安排了人赶快修改一下这个规则,修改好以后会在这里留言通知大家
...

谢谢了!作为一个文科生差点怀疑了我的智商

希望快一点啊,全网找了你们的最合适了

举报 使用道具
Fuller 管理员 发表于 2019-1-4 10:14:49 | 显示全部楼层
ritachen 发表于 2019-1-3 21:18
谢谢了!作为一个文科生差点怀疑了我的智商

希望快一点啊,全网找了你们的最合适了

修改完成,可以用了
举报 使用道具
ritachen 初级会员 发表于 2019-1-4 21:42:29 | 显示全部楼层
Fuller 发表于 2019-1-4 10:14
修改完成,可以用了

试了三次,确实采集了很长时间,但是最后采到的只有2条,可是问题有3000多条呢?最后都说脚本错误。捉急……
1.png
2.png
3.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:23