6 13855

打数时页面跳转不了

huangkaikay88 于 2015-9-17 09:14 发表 [复制链接]
有两个问题请教一下。
1、在我抓数时,在一个页面抓完数后,滚屏到底部这个页面就一直在跳动,无法翻转,也没有打数结果。不知道是什么原因呢?如下图

2、我有几个主题,在点击激活所有线索,激活失败线索后,依然弹出提示没有等待抓取的线索,可创建新线索或激活已有线索。 这又是什么原因呢?请指教。

3.PNG 4.PNG
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2015-9-17 16:25

wangyong 版主 发表于 2015-9-17 09:35:03 | 显示全部楼层
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?
举报 使用道具
gooseeker_info 金牌会员 发表于 2015-9-17 09:43:28 | 显示全部楼层
首先检查一下MS谋数台上的“创建规则”工作台,看看每个抓取内容,根据需要给抓取内容设置“关键内容”属性,很多页面的抓取,要求只是给一个抓取内容设置“关键内容”

其次,用DS打数机,在主题列表上选择一个主题,点鼠标右键,点菜单,统计一下有多少线索,是不是可用线索是0?

很有可能定义的抓取规则不正确,没有生成线索
举报 使用道具
huangkaikay88 初级会员 发表于 2015-9-17 09:43:35 | 显示全部楼层
wangyong 发表于 2015-9-17 09:35
第一问可能是规则不适应,第二问是不是用crontab调度爬虫了?

多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版面形式的,就跳转不过去的。
第二个问题我是直接在打数台上爬虫的,有的线索可以,有的就会显示没有等待抓取的线索,不知道您说的crontab调度在哪儿呢?是不是这个原因。
举报 使用道具
wangyong 版主 发表于 2015-9-17 15:38:50 | 显示全部楼层
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

这样的话针对不同的网页结构可以做不同的采集规则,参看教程:http://www.gooseeker.com/doc/thread-445-1-1.html
举报 使用道具
wangyong 版主 发表于 2015-9-17 15:39:20 | 显示全部楼层
huangkaikay88 发表于 2015-9-17 09:43
多谢回复! 规则不适应一般会出问题在哪儿呢?我抓取的网页是搜索列表的形式的就可以,但是网页是阅读版 ...

激活的时候提示成功了吗?
举报 使用道具
huangkaikay88 初级会员 发表于 2015-9-17 16:25:16 | 显示全部楼层
wangyong 发表于 2015-9-17 15:39
激活的时候提示成功了吗?

非常感谢。现在感觉可以了。真的谢谢你们耐心解答这些比较基础的问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:55