快捷导航
6 12413

打数时页面跳转不了

huangkaikay88 于 2015-9-17 09:14 发表 [复制链接]
有两个问题请教一下。
1、在我抓数时,在一个页面抓完数后,滚屏到底部这个页面就一直在跳动,无法翻转,也没有打数结果。不知道是什么原因呢?如下图

2、我有几个主题,在点击激活所有线索,激活失败线索后,依然弹出提示没有等待抓取的线索,可创建新线索或激活已有线索。 这又是什么原因呢?请指教。

3.PNG 4.PNG
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2015-9-17 16:25

wangyong 版主 发表于 2015-9-17 09:35:03 | 显示全部楼层
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?
举报 使用道具
gooseeker_info 金牌会员 发表于 2015-9-17 09:43:28 | 显示全部楼层
首先检查一下MS谋数台上的“创建规则”工作台,看看每个抓取内容,根据需要给抓取内容设置“关键内容”属性,很多页面的抓取,要求只是给一个抓取内容设置“关键内容”

其次,用DS打数机,在主题列表上选择一个主题,点鼠标右键,点菜单,统计一下有多少线索,是不是可用线索是0?

很有可能定义的抓取规则不正确,没有生成线索
举报 使用道具
huangkaikay88 初级会员 发表于 2015-9-17 09:43:35 | 显示全部楼层
wangyong 发表于 2015-9-17 09:35
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?

多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版面形式的,就跳转不过去的。
第二个问题我是直接在打数台上爬虫的,有的线索可以,有的就会显示没有等待抓取的线索,不知道您说的crontab调度在哪儿呢?是不是这个原因。
举报 使用道具
wangyong 版主 发表于 2015-9-17 15:38:50 | 显示全部楼层
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

这样的话针对不同的网页结构可以做不同的采集规则,参看教程:http://www.gooseeker.com/doc/thread-445-1-1.html
举报 使用道具
wangyong 版主 发表于 2015-9-17 15:39:20 | 显示全部楼层
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

激活的时候提示成功了吗?
举报 使用道具
huangkaikay88 初级会员 发表于 2015-9-17 16:25:16 | 显示全部楼层
wangyong 发表于 2015-9-17 15:39
激活的时候提示成功了吗?

非常感谢。现在感觉可以了。真的谢谢你们耐心解答这些比较基础的问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 如何采集微博博主主页并生成共现矩阵用于Ge
  • Gephi社会网络分析-网络图Force Atlas布局
  • 对共词关系求协方差矩阵后再用Girvan-Newma
  • 社区发现算法Girvan-Newman(GN)是否能应用
  • 使用GooSeeker分词和Gephi进行中文文本分析

热门用户

GMT+8, 2023-9-27 23:40