本帖最后由 fooldio 于 2021-6-24 11:28 编辑

网址如下:
http://app1.nmpa.gov.cn/data_nmp ... GWB18Y_wMSzdwb0qqo9
需求:
1、搜索框输入指定关键词(比如“软件”),并点击搜索。(已完成,用连续动作)
2、在搜索结果页面点击各详情,并爬取数据,在详情页点击返回(每页15条)
3、翻页直到遍历所有结果
问题:
1、因为搜索结果传递不是以具体网址形式,所以无法用“下级网址“来实现遍历当前页
2、如何进入详情页,又如何返回?
3、基于2,如何组合路线、规则和动作来实现需求

新版本界面不太熟悉,加上网站比较特殊,故求助!还请解答

做了两个支离破碎的任务:
1、NMPA爬影像软件,可以实现输入和点击,不能翻页,进不了详情页
2、软件详情采集,可以在详情页爬关键数据,但是不知道如何返回,以及如何结合到前面的任务里。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-6-24 13:15

沙发
Fuller 管理员 发表于 2021-6-24 12:30:13 | 只看该作者
举报 使用道具
板凳
fooldio 初级会员 发表于 2021-6-24 13:15:24 | 只看该作者
Fuller 发表于 2021-6-24 12:30
看看这个教程https://www.gooseeker.com/doc/article-556-1.html

感谢支持,我去看下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 03:04