快捷导航
我想问一下可以实现自动收集国家专利局提供的专利检索中心的专利吗?
这个网站需要自己输入条件的,我想实现打开网页后自动输入条件,然后采集检索后的结果 16-10-19 专利信息采集.jpg
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-3-15 17:55

Fuller 管理员 发表于 2016-10-19 15:14:46 | 显示全部楼层
这种需求要使用连续动作功能,每个输入框或者按钮都对应一个动作步骤,在一组连续动作中可以定义很多动作步骤。为每个动作步骤编写XPath定位表达式,如果这个XPath计算得到多个DOM节点,那么意味着这个动作是要做多次的。连续动作的教程参看:http://www.gooseeker.com/doc/article-141-1.html
举报 使用道具
xandy 版主 发表于 2016-10-19 17:17:46 | 显示全部楼层
假如说你的手上有一个申请人列表,需要采集这些申请人的检索专利信息。
你需要定义两个规则
规则一:定义你的动作,即动作一:在申请人中输入公司名称,动作二:点击检索按钮。
规则二:定义采集规则,给检索出来的内容做映射
不管你的申请人列表有多长,集搜客爬虫连续动作都可以实现自动输入
举报 使用道具
w269750749 新手上路 发表于 2018-3-15 17:36:16 | 显示全部楼层
我想问一下楼主实现了吗
举报 使用道具
Fuller 管理员 发表于 2018-3-15 17:55:31 | 显示全部楼层
w269750749 发表于 2018-3-15 17:36
我想问一下楼主实现了吗

自动输入和其他动作都已经实现了。申请号你得预先整理出来。如果要采集很多的话,需要购买旗舰版,具有连发弹仓功能,能够大批量输入申请号。免费版只能输入5个做在规则中的申请号。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 城市要素库时空分析系统开发设计要点
  • 用GooSeeker爬虫实现自动点击抓取淘宝sku库
  • 城市要素库时空分析系统建设思路
  • 用Excel Power Map作招聘数据分析和空间可
  • 如何完整抓取搜狐新闻文章?

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-4-23 21:19