集搜客GooSeeker网络爬虫

标题: 输入关键词后只执行第一个关键词 [打印本页]

作者: jesscia_2020    时间: 2022-9-28 13:59
标题: 输入关键词后只执行第一个关键词
需求:输入关键词,查询,查询后采集结果信息。
建立了两个任务:
1.专利号信息查询(此任务设置了动作,两个输入和查询,并且在输入导入了关键词)
2.专利数据详情,查询后执行此任务采集数据。
目前专利号信息查询,只执行第一个关键词后就结束了。请帮忙看一下

作者: gz51837844    时间: 2022-9-28 15:31
这个中国专利公布公告网的查询,第一个关键词是在初始页输入关键词和点击查询, 而第二个关键词是在结果页输入关键词和点击查询的
两个页面的结构不一样,所以在写输入动作和点击查询动作的xpath时,需要做到兼容2种页面结构
[attach]15595[/attach]

[attach]15596[/attach]

作者: gz51837844    时间: 2022-9-28 15:32
可以这样修改:
输入动作的xpath: //*[@id='searchStr']
点击动作的xpath://*[@class='sbtn' or @class='btn']

作者: jesscia_2020    时间: 2022-9-28 18:00
那怎么接着采集详情页信息呢,我设置了采集详情任务,但是这个执行完了如何执行采集详情呢
作者: gz51837844    时间: 2022-9-28 18:13
jesscia_2020 发表于 2022-9-28 18:00
那怎么接着采集详情页信息呢,我设置了采集详情任务,但是这个执行完了如何执行采集详情呢 ...

按你的两级规则采集路线,如果正常执行,第2级应该已经采集了

作者: jesscia_2020    时间: 2022-9-29 06:02
还是只取第一个值,另外请帮忙看看第二规则对吗
作者: gz51837844    时间: 2022-9-29 08:46
jesscia_2020 发表于 2022-9-29 06:02
还是只取第一个值,另外请帮忙看看第二规则对吗

你说的“只取第一个值”的情况,第一个值的执行正确吗? 第一个值有没有正确的输入,点击查询,采集?





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2