Fuller 管理员 发表于 2017-2-17 18:35:23 | 显示全部楼层
liuhu521 发表于 2017-2-17 16:49
BB-Primalush-1抓取内容有的,在浏览器也看到连续点击动作了,就是BB-Primalush-2 没用,没启动

...

刚才我加载你的规则,你的第二个规则的主题名不对,与第一个规则的“连续动作”工作台上填写的对不上,所以,执行不了。

另外,第一个规则中,连续动作的额外延时不用100秒,5秒就行了,如果网页加载很慢,DS打数机一般会自己做适当的等待的。

这个关键问题是 主题名没有对上
举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 10:01:38 | 显示全部楼层
Fuller 发表于 2017-2-17 18:35
刚才我加载你的规则,你的第二个规则的主题名不对,与第一个规则的“连续动作”工作台上填写的对不上,所 ...

非常谢谢啊

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 11:35:47 | 显示全部楼层
Fuller 发表于 2017-2-17 18:35
刚才我加载你的规则,你的第二个规则的主题名不对,与第一个规则的“连续动作”工作台上填写的对不上,所 ...

你好,我重新修改后BB-Primalush-1和-2 后,-1可以完全加载抓取成功,-2显示是规则匹配失败,我自己感觉规则没有错误。求指教。。。。

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 13:02:42 | 显示全部楼层
Fuller 发表于 2017-2-17 18:35
刚才我加载你的规则,你的第二个规则的主题名不对,与第一个规则的“连续动作”工作台上填写的对不上,所 ...

你好,在吗?上次运行时BB-Primalush-1 运行成功,再次加载他也出现匹配失败,显示是再调度失败,然后就一直在抓取中。。。这是什么原因呢?

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 13:09:57 | 显示全部楼层
报错信息是:加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是.//*[@id='BVRRReviewAbbreviatedText149825976_dg69hik3fe98xmtmn5eya9p4p_ID']/div/span[position()=1]/text()
无法定位抓取内容 No.2 (情景2);XPath是preceding-sibling::div[position()=2]/div[position()=1]/div/div/div/div/div[position()=2]/img/@title

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[.//a//text()="next" and @class='BVRRFooter BVRRDisplayContentFooter']
无法定位线索0;定位用XPath:<context>//*[.//a//text()="next" and @class='BVRRFooter BVRRDisplayContentFooter']</context>。跳过!
无法定位网页内容,基于XPath://*[.//a//text()="next" and @class='BVRRFooter BVRRDisplayContentFooter']
无法定位记号
经检查,记号(next)不符合要求,原因:节点号不正确
这应该是BB-1没有匹配成功造成的吧?
举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 13:24:04 | 显示全部楼层
liuhu521 发表于 2017-2-21 13:02
你好,在吗?上次运行时BB-Primalush-1 运行成功,再次加载他也出现匹配失败,显示是再调度失败,然后就 ...

再次调度失败是不是因为-2里面的规则不对,我修改后,从重新抓取-1和-2 可以得到数据,但只是很少的几个,没有全部数据抓取,这又是为啥呢?

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 14:11:51 | 显示全部楼层
Fuller 发表于 2017-2-17 18:35
刚才我加载你的规则,你的第二个规则的主题名不对,与第一个规则的“连续动作”工作台上填写的对不上,所 ...

你好,经过修改,现在点击-1运行加载可以自动加载-2的规则,但是最后抓取的内容在-2 文件中导出来,评价详情里是空的,没有抓取到内容。。。。

举报 使用道具
HJLing 版主 发表于 2017-2-21 14:23:16 | 显示全部楼层
liuhu521 发表于 2017-2-21 14:11
你好,经过修改,现在点击-1运行加载可以自动加载-2的规则,但是最后抓取的内容在-2 文件中导出来,评价 ...

测试你的两个规则都没有问题 正常点击也采了评论
不过你的第二级 不用勾选高级设置
QQ截图20170221142250.png
把评价详情跟星级的高级设置都去掉

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 14:38:13 | 显示全部楼层
HJLing 发表于 2017-2-21 14:23
测试你的两个规则都没有问题 正常点击也采了评论
不过你的第二级 不用勾选高级设置

谢谢,非常感谢!!

举报 使用道具
liuhu521 初级会员 发表于 2017-2-21 14:58:17 | 显示全部楼层
HJLing 发表于 2017-2-21 14:23
测试你的两个规则都没有问题 正常点击也采了评论
不过你的第二级 不用勾选高级设置

你好我又创建了一个BB-Primalush-0的规则,想直接从列表页面直接采集到各个产品的评论,为什么到第二集时出现匹配失败呢?麻烦您帮我看看规则是否正确

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:03