结合了几个帖终于实现,方法给大家参考下,祝一次成功。

首先直接查看:https://www.gooseeker.com/doc/article-371-1.html
第一级规则先定义连续动作,第二级规则才定义需要采集的评论文本。


第一级规则中进行连续动作的定义,综合了https://www.gooseeker.com/doc/thread-10363-1-1.html、https://www.gooseeker.com/doc/thread-17634-1-1.html、https://www.gooseeker.com/doc/thread-11418-1-1.html才实现,即:
1,点击累计评价://div/ul/li[contains(./a/text(),'累计评价')]
2,点击排序框://*[@class='tm-current']
3,点击时间排序://*[@class='tm-r-time'],这个还需打开
高级设置取消模拟点击,设置上延时3秒

需要注意:第二级规则的主题名 需和 第一级规则的连续动作填写的目标任务名一致。


其他的仔细查看第一个链接的教程。


实现不了的话,就当没发过这帖哈。


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-9-29 15:28

沙发
wangyong 版主 发表于 2020-9-29 15:28:25 | 只看该作者
这个方法可以实现,但是可以更加单,只保留第一步和第三步连续动作就行,第三步取消模拟点击后爬虫就能自动点击到按时间排序
1,点击累计评价://div/ul/li[contains(./a/text(),'累计评价')]
2,点击时间排序://*[@class='tm-r-time'],这个还需打开高级设置取消模拟点击,设置上延时3秒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-1-24 09:27