本人自定义了两个任务完成完成京东商品评论抓取,用的是增加版爬虫,一级是用来点击“商品评价”,二级是用来翻页抓取评论,但一级设置路线后一直无法模拟点击“商品评价”传递到二级,二级始终无法抓取,请问如何处理。我的两个任务规则名称:一级规则是这个suibe_EC_JDRewierT1,二级规则是suibe_EC_JDRewierT2。
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-10-4 22:49

沙发
Fuller 管理员 发表于 2021-10-4 18:23:00 | 只看该作者


京东网页有个特点,往下滚屏以后,商品评价所在的那一条就变成悬浮的了,这个悬浮条上的“商品评价”跟原来的不是一个,如果你做翻页规则,使用了最初的那个“商品评价”,就不能开滚屏。如果你要开自动滚屏,为翻页做下一页映射的时候,要先手工滚屏,变成了悬浮条再做规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2021-10-4 18:24:53 | 只看该作者


看翻页规则的方法是点击“测试”按钮,就能看到生成的翻页规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
wangshift 金牌会员 发表于 2021-10-4 20:22:45 | 只看该作者
Fuller 发表于 2021-10-4 18:24
看翻页规则的方法是点击“测试”按钮,就能看到生成的翻页规则

好的,谢谢。
举报 使用道具
5#
wangshift 金牌会员 发表于 2021-10-4 21:02:07 | 只看该作者
Fuller 发表于 2021-10-4 18:23
京东网页有个特点,往下滚屏以后,商品评价所在的那一条就变成悬浮的了,这个悬浮条上的“商品评价”跟原 ...

  请问如何关闭自动滚屏,我看在调度设置的采集设置中"滚屏采集”默认都是“否”,自动滚屏是哪一个?
举报 使用道具
6#
wangshift 金牌会员 发表于 2021-10-4 22:22:22 | 只看该作者
Fuller 发表于 2021-10-4 18:23
京东网页有个特点,往下滚屏以后,商品评价所在的那一条就变成悬浮的了,这个悬浮条上的“商品评价”跟原 ...

请问数据管家中哪儿可以设置“自动滚屏”的开关,数据调度中采集设置“滚屏采集”默认都是否?
举报 使用道具
7#
Fuller 管理员 发表于 2021-10-4 22:49:27 | 只看该作者
wangshift 发表于 2021-10-4 22:22
请问数据管家中哪儿可以设置“自动滚屏”的开关,数据调度中采集设置“滚屏采集”默认都是否?
...

调度中心里面的设置是给爬虫群用的,就是自动启动的爬虫任务。参看教程:https://www.gooseeker.com/doc/article-529-1.html

如果是手工启动的爬虫任务,不使用调度参数。所谓手工启动的,比如,定义规则的工作台上有一个“采集”按钮,这种就是手工启动的。在会员中心的任务管理那里,任务列表中每个任务都有启动采集菜单,也是手工启动的。手工启动的任务,使用爬虫配置界面上设置的参数,具体参看:https://www.gooseeker.com/doc/article-528-1.html


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 07:02