11#
Fuller 管理员 发表于 2020-9-1 10:16:24 | 只看该作者
xiaogang184211 发表于 2020-9-1 09:59
最后一级翻页还需要指向点击规则吗,如果要,不就是只要执行分公司2这个点击任务,其他都不需要改吗
...

规则1:点击返回按钮 -》 规则2:点击证券公司 -》 规则3: 点击 分公司tab -》 规则4:翻页采集分公司

应该是这样的,不过要实验一下
举报 使用道具
12#
xiaogang184211 初级会员 发表于 2020-9-1 10:42:16 | 只看该作者
Fuller 发表于 2020-9-1 10:16
规则1:点击返回按钮 -》 规则2:点击证券公司 -》 规则3: 点击 分公司tab -》 规则4:翻页采集分公司

...

规则4翻页采集分公司,没有指向的话,就不会在循环采集证券公司基本信息3里面的其他公司了
举报 使用道具
13#
wangyong 版主 发表于 2020-9-1 15:54:45 | 只看该作者

1,第一级规则不做点击和回退,直接通过抓取@onclick,就可以通过Excel构造下级页面的网址,实现层级抓取
https://jg.sac.net.cn/pages/publicity/indicatorsFrame.html?aoi_id=5971&is_org_search=no

2,第二级规则点击“分公司”按钮调整到第三级

3,在第三级页面上进行翻页,由于是层级抓取也就不需要设置返回到第一级了


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
14#
Fuller 管理员 发表于 2020-9-1 15:55:19 | 只看该作者
xiaogang184211 发表于 2020-9-1 10:42
规则4翻页采集分公司,没有指向的话,就不会在循环采集证券公司基本信息3里面的其他公司了
...

应该不会,这个网站我们曾经采集过,不过不是我做的规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-22 01:36