本帖最后由 fooldio 于 2021-6-24 11:28 编辑

网址如下:
http://app1.nmpa.gov.cn/data_nmp ... GWB18Y_wMSzdwb0qqo9
需求:
1、搜索框输入指定关键词(比如“软件”),并点击搜索。(已完成,用连续动作)
2、在搜索结果页面点击各详情,并爬取数据,在详情页点击返回(每页15条)
3、翻页直到遍历所有结果
问题:
1、因为搜索结果传递不是以具体网址形式,所以无法用“下级网址“来实现遍历当前页
2、如何进入详情页,又如何返回?
3、基于2,如何组合路线、规则和动作来实现需求

新版本界面不太熟悉,加上网站比较特殊,故求助!还请解答

做了两个支离破碎的任务:
1、NMPA爬影像软件,可以实现输入和点击,不能翻页,进不了详情页
2、软件详情采集,可以在详情页爬关键数据,但是不知道如何返回,以及如何结合到前面的任务里。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-6-24 13:15

沙发
Fuller 管理员 发表于 2021-6-24 12:30:13 | 只看该作者
举报 使用道具
板凳
fooldio 初级会员 发表于 2021-6-24 13:15:24 | 只看该作者
Fuller 发表于 2021-6-24 12:30
看看这个教程https://www.gooseeker.com/doc/article-556-1.html

感谢支持,我去看下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的

热门用户

GMT+8, 2026-5-5 09:14