141#
goodhanbin 中级会员 发表于 2019-12-13 15:55:34 | 只看该作者
Fuller 发表于 2019-12-13 15:50
因为要定义多级采集,我们又没有这个网站的账号,不好测试。
第一级规则定义了翻页采集了吗?

第一级规则,有做自定义翻页
举报 使用道具
142#
goodhanbin 中级会员 发表于 2019-12-13 16:04:49 | 只看该作者
Fuller 发表于 2019-12-13 15:50
因为要定义多级采集,我们又没有这个网站的账号,不好测试。
第一级规则定义了翻页采集了吗?

第一级规则,有自定义翻页
举报 使用道具
143#
Fuller 管理员 发表于 2019-12-13 16:26:43 | 只看该作者
goodhanbin 发表于 2019-12-13 16:04
第一级规则,有自定义翻页

转到这个帖子进行讨论吧:https://www.gooseeker.com/doc/thread-15838-1-1.html
举报 使用道具
144#
goodhanbin 中级会员 发表于 2019-12-17 12:38:42 | 只看该作者
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

我的问题,和他楼主反馈一样,二级规则,还是无法自动翻页
举报 使用道具
145#
goodhanbin 中级会员 发表于 2019-12-17 12:39:05 | 只看该作者
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

我的问题,和他楼主反馈一样,二级规则,还是无法自动翻页
举报 使用道具
146#
goodhanbin 中级会员 发表于 2019-12-18 17:55:42 | 只看该作者
maohui 发表于 2018-7-17 23:11
关于翻页问题,从你的截图看,一级和二级的翻页的样式一模一样。在爬虫路线工作台上,点击“查看规则”按钮 ...

二级界面窗口,连续翻页,解决了,

但是,二级界面窗口,第一行的所有页面采完之后,返回一级规则界面时,直接跳到第4行采集了,中间的2-3行未采;

同时,一级规则第一页采完之后,打数机便停止了,未做翻页

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
147#
goodhanbin 中级会员 发表于 2019-12-19 08:26:45 | 只看该作者
Fuller 发表于 2019-4-15 16:39
没错啊,就是两级规则:
第一级规则:点击浏览次数,弹出一个窗口,交给第二个规则去采集
第二级规则:采 ...

  第二次规则,增加一个动作:点x关闭窗口,主题名:第一级规则,这样二级规则就不会翻页了
举报 使用道具
148#
Fuller 管理员 发表于 2019-12-19 09:27:27 | 只看该作者
goodhanbin 发表于 2019-12-19 08:26
第二次规则,增加一个动作:点x关闭窗口,主题名:第一级规则,这样二级规则就不会翻页了
...

在这个新问题上讨论吧,按照我说的,先做一个点击用于清理网页上的窗口,再用第二个点击把新窗口点出来:https://www.gooseeker.com/doc/thread-15845-1-1.html
举报 使用道具
149#
goodhanbin 中级会员 发表于 2020-6-8 16:53:29 | 只看该作者
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

楼主,也能做出来,但是为何我这边不行呢?盼指教,甚为感谢!

第二级规则,随着一级规则翻页之后,第二级规则不执行了,只采集第一级规则的第一页数据,
举报 使用道具
150#
Fuller 管理员 发表于 2020-6-8 16:56:43 | 只看该作者
goodhanbin 发表于 2020-6-8 16:53
楼主,也能做出来,但是为何我这边不行呢?盼指教,甚为感谢!

第二级规则,随着一级规则翻页之后,第二 ...

这个帖子是好早以前的了,网站一定会改版的。爬这个数据有很大难度,因为要连续做好几级规则。中间某一级有问题,就会影响后面的。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 21:41