有两个问题请教一下。
1、在我抓数时,在一个页面抓完数后,滚屏到底部这个页面就一直在跳动,无法翻转,也没有打数结果。不知道是什么原因呢?如下图

2、我有几个主题,在点击激活所有线索,激活失败线索后,依然弹出提示没有等待抓取的线索,可创建新线索或激活已有线索。 这又是什么原因呢?请指教。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2015-9-17 16:25

沙发
wangyong 版主 发表于 2015-9-17 09:35:03 | 只看该作者
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?
举报 使用道具
板凳
gooseeker_info 金牌会员 发表于 2015-9-17 09:43:28 | 只看该作者
首先检查一下MS谋数台上的“创建规则”工作台,看看每个抓取内容,根据需要给抓取内容设置“关键内容”属性,很多页面的抓取,要求只是给一个抓取内容设置“关键内容”

其次,用DS打数机,在主题列表上选择一个主题,点鼠标右键,点菜单,统计一下有多少线索,是不是可用线索是0?

很有可能定义的抓取规则不正确,没有生成线索
举报 使用道具
地板
huangkaikay88 初级会员 发表于 2015-9-17 09:43:35 | 只看该作者
wangyong 发表于 2015-9-17 09:35
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?

多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版面形式的,就跳转不过去的。
第二个问题我是直接在打数台上爬虫的,有的线索可以,有的就会显示没有等待抓取的线索,不知道您说的crontab调度在哪儿呢?是不是这个原因。
举报 使用道具
5#
wangyong 版主 发表于 2015-9-17 15:38:50 | 只看该作者
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

这样的话针对不同的网页结构可以做不同的采集规则,参看教程:http://www.gooseeker.com/doc/thread-445-1-1.html
举报 使用道具
6#
wangyong 版主 发表于 2015-9-17 15:39:20 | 只看该作者
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

激活的时候提示成功了吗?
举报 使用道具
7#
huangkaikay88 初级会员 发表于 2015-9-17 16:25:16 | 只看该作者
wangyong 发表于 2015-9-17 15:39
激活的时候提示成功了吗?

非常感谢。现在感觉可以了。真的谢谢你们耐心解答这些比较基础的问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 06:42