像淘宝这种页面,显示评论需要点击累积评论,但是模拟点击我是在上一级做的。到了这一级规则,宝贝详情页跟累计评论页的网址一样。所以自动显示的还是宝贝详情。是不是这个原因?导致规则中内容定位,标志定位失败?
那面对这种情况,我该怎么设置?如何加载之后,直接显示累计评论?
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2018-5-28 10:28

沙发
ym 版主 发表于 2016-6-28 11:06:51 | 只看该作者
本帖最后由 ym 于 2016-6-28 14:47 编辑

可参考淘宝评论采集的视频教程http://www.gooseeker.com/doc/thread-978-1-1.html

关于你遇到的问题,解答如下:
1、假设有两级规则,第一级是模拟点击,第二级是点击后的页面,由于模拟点击是连贯动作,DS打数机采集第一级的数据时,就会自动点击,然后进入到第二级规则,而不是直接运行第二级规则,因为是同个网址,对于不同页签的内容要点击后才加载显示出来的情况,必须要点击才能加载出数据,所以,没有运行第一级的话,第二级就会采集失败。参见http://www.gooseeker.com/doc/article-150-1.html

2、采集淘宝评论,设置模拟点击时,由于点击的文字前后有空格,不同商品页空格的数量差异就可能会采集失败,解决方法:不勾全匹配,并且删掉前后的空格,具体参见http://www.gooseeker.com/doc/thread-1535-1-1.html

3、无论是加载什么规则,样本页面都要与做规则时的完全一致,否则都会失败。所以,加载第二级规则时,先要取消勾内容定位,人工点击“累计评价”,转到评论页面后,再点击文件菜单->后续分析。参见http://www.gooseeker.com/doc/thread-930-1-1.html
举报 使用道具
板凳
759924607 高级会员 发表于 2016-6-28 11:36:37 | 只看该作者
ym 发表于 2016-6-28 11:06
可参考淘宝评论采集的视频教程http://www.gooseeker.com/doc/thread-978-1-1.html

关于你遇到的问题,解答 ...

哦哦!明白了。感谢感谢!
举报 使用道具
地板
summous 新手上路 发表于 2016-6-28 14:18:42 | 只看该作者
759924607 发表于 2016-6-28 11:36
哦哦!明白了。感谢感谢!

你采集成功了吗,为什么我第一级运行的时候总是超时
举报 使用道具
5#
759924607 高级会员 发表于 2016-6-28 14:26:43 | 只看该作者
summous 发表于 2016-6-28 14:18
你采集成功了吗,为什么我第一级运行的时候总是超时

之前我采集数据,有好多也是超时。大部分情况是规则不完善,还有一少部分是需要在打数机中设置一下。总之····这个入门还真是难。我也弄了快一个月了。。。。多发帖子交流吧。
举报 使用道具
6#
Fuller 管理员 发表于 2016-6-28 18:31:17 | 只看该作者
759924607 发表于 2016-6-28 14:26
之前我采集数据,有好多也是超时。大部分情况是规则不完善,还有一少部分是需要在打数机中设置一下。总之 ...

淘宝和微博,网页内容都比较复杂,用了大量的动态技术,采集规则比较不好做
举报 使用道具
7#
759924607 高级会员 发表于 2016-6-28 18:37:03 | 只看该作者
Fuller 发表于 2016-6-28 18:31
淘宝和微博,网页内容都比较复杂,用了大量的动态技术,采集规则比较不好做 ...

Fuller大哥!我想问问您这个是啥原因引起的。在打数机中找到失败的线索,然后再加载,出现这么个情况。(淘宝下边有天猫页面,也有淘宝页面,我也建了两个规则)


123.jpg (6.68 KB, 下载次数: 0)
下载附件
半小时前 上传





加载完毕,我点击后续分析。然后直接报错了。


322.jpg (46.77 KB, 下载次数: 0)
下载附件
半小时前 上传





终于找到问题所在了。发现淘宝页面竟然打开的是天猫的规则,所以规则中整理箱内容都失效了。
可是我直接加载淘宝页面的规则,网页标志设置的正确、测试什么都是正确的,就是打数的时候,淘宝页面用的天猫规则。您知道这是什么原因引起的吗?


QQ截图20160628175102.jpg (75.69 KB, 下载次数: 0)
下载附件
半小时前 上传





举报 使用道具
8#
Fuller 管理员 发表于 2016-6-28 19:57:58 | 只看该作者
打数的时候,如果规则做的好,DS是自动选择一个合适的规则,不会出问题。
加载的时候,MS不会自动选择,需要手工选择,刚才你的截图“通过切换确定一个合适的”,你分析规则过程,发现是淘宝的,那么你可以切换成天猫的,使用MS菜单 工具-》切换规则,切换以后,可以选择菜单 文件-》 分析页面,看看规则能否分析成功
举报 使用道具
9#
Fuller 管理员 发表于 2018-5-28 10:28:07 | 只看该作者
现在,采集淘宝评论,用Gooseeker快捷采集,输入网址,即可采集,还可设置采集页数,想采多少页,就采多少页。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 22:11