想抓取淘宝商品累计评论里面的好评数据,
自己目前操作的是做三级规则,一层层模拟点击映射,
但是从第一级规则开始运行,运行到累计评论页面就停止了。
请问怎么解决?


举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2021-11-1 11:25

来自 21#
wangyong 版主 发表于 2021-11-1 11:25:52 | 只看该作者
集搜客可以快捷采集中有淘宝评论好评采集淘宝评论中评采集淘宝评论差评采集
使用方法相同,选择对应的采集入口,在快捷采集输入要采集的商品网址后就可以采集了
下面以采集淘宝商品好评为例,介绍怎样采集
1,安装集搜客数据管家,从左侧工具条进入快捷采集,选择淘宝评论好评采集,输入要采集的商品链接,点击“获取数据按钮”,就开始采集数据了

2,在快捷采集后台中,看到采集任务的状态变为“已采集”后,就可以点击打包按钮下载数据了


举报 使用道具
沙发
lilyzoo 初级会员 发表于 2017-3-21 21:20:46 | 只看该作者
附加图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2017-3-21 21:35:47 | 只看该作者
第二级规则你想点击“好评”那个旋钮?规则加载失败,所以,第三级就执行不到
举报 使用道具
地板
Fuller 管理员 发表于 2017-3-21 21:43:55 | 只看该作者



你做的映射都对,“好评”这个词前后有很多空格,作为记号的话,需要把前后的空格删除,删除以后,就不能勾“全匹配”了,你的错误就是勾了全匹配

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
lilyzoo 初级会员 发表于 2017-3-23 20:49:23 | 只看该作者
本帖最后由 lilyzoo 于 2017-3-23 20:59 编辑
Fuller 发表于 2017-3-21 21:43
你做的映射都对,“好评”这个词前后有很多空格,作为记号的话,需要把前后的空格删除,删除以后,就不 ...

您好,我按照您的解答在记号值那边做了更改。整个三级规则做下来没有规则报错,但是在爬数据的时候(用第一级规则爬的),想多爬取几页就点的集搜,可是打数机依旧在点击累计评价后的页面之后就空白了,请问集搜是这样用的吗?如果想爬好评按钮下的多页数据是否还要做一层规则?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-23 22:12:05 | 只看该作者
根据你的描述,似乎一切是正确的。运行应该从第一级开始,在运行之前要打开DS打数机的滚屏功能,就是用菜单设置滚屏参数,把滚屏次数设置成大于0的数字,你设置了吗?
举报 使用道具
7#
Fuller 管理员 发表于 2017-3-23 22:21:14 | 只看该作者
加载了你的规则,第二级有问题,加载失败,第二级不用定义那么多抓取内容,要第一项就行了,减少失败的概率。
举报 使用道具
8#
Fuller 管理员 发表于 2017-3-23 22:26:03 | 只看该作者
我又测试了一遍,虽然第二级没有问题了,但是点击不了“好评”,似乎应该用连续动作中的点击类型来做这个动作,而不是用爬虫路线里面的连贯抓取
举报 使用道具
9#
Fuller 管理员 发表于 2017-3-23 22:40:00 | 只看该作者
刚才我把第二级改成连续动作了,做个点击动作,而且设置高级设置,勾上模拟点击,额外延迟3秒,所用的xpath
  1. //*[@class='J_KgRate_Filter filtering']/li[position()=4]/label/input
复制代码

测试成功
举报 使用道具
10#
lilyzoo 初级会员 发表于 2017-3-24 00:10:24 | 只看该作者
Fuller 发表于 2017-3-23 22:40
刚才我把第二级改成连续动作了,做个点击动作,而且设置高级设置,勾上模拟点击,额外延迟3秒,所用的xpath ...

半夜逛手机跑来看回复!

真的太敬业了!
明早起来就去实践!
一把抱住!
谢谢谢谢!

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 07:09