我想问一下可以实现自动收集国家专利局提供的专利检索中心的专利吗?
这个网站需要自己输入条件的,我想实现打开网页后自动输入条件,然后采集检索后的结果 16-10-19 专利信息采集.jpg
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2019-1-31 17:04

Fuller 管理员 发表于 2016-10-19 15:14:46 | 显示全部楼层
这种需求要使用连续动作功能,每个输入框或者按钮都对应一个动作步骤,在一组连续动作中可以定义很多动作步骤。为每个动作步骤编写XPath定位表达式,如果这个XPath计算得到多个DOM节点,那么意味着这个动作是要做多次的。连续动作的教程参看:http://www.gooseeker.com/doc/article-141-1.html
举报 使用道具
xandy 论坛元老 发表于 2016-10-19 17:17:46 | 显示全部楼层
假如说你的手上有一个申请人列表,需要采集这些申请人的检索专利信息。
你需要定义两个规则
规则一:定义你的动作,即动作一:在申请人中输入公司名称,动作二:点击检索按钮。
规则二:定义采集规则,给检索出来的内容做映射
不管你的申请人列表有多长,集搜客爬虫连续动作都可以实现自动输入
举报 使用道具
w269750749 新手上路 发表于 2018-3-15 17:36:16 | 显示全部楼层
我想问一下楼主实现了吗
举报 使用道具
Fuller 管理员 发表于 2018-3-15 17:55:31 | 显示全部楼层
w269750749 发表于 2018-3-15 17:36
我想问一下楼主实现了吗

自动输入和其他动作都已经实现了。申请号你得预先整理出来。如果要采集很多的话,需要购买旗舰版,具有连发弹仓功能,能够大批量输入申请号。免费版只能输入5个做在规则中的申请号。
举报 使用道具
bi_hang 新手上路 发表于 2019-1-30 19:42:27 | 显示全部楼层
请问可以检索IPC分类号和地区这些信息吗?
举报 使用道具
shenzhenwan10 金牌会员 发表于 2019-1-30 20:35:01 | 显示全部楼层
bi_hang 发表于 2019-1-30 19:42
请问可以检索IPC分类号和地区这些信息吗?

人工可以检索到IPC分类号和地区这些信息吗?


举报 使用道具
Fuller 管理员 发表于 2019-1-30 22:37:20 | 显示全部楼层
bi_hang 发表于 2019-1-30 19:42
请问可以检索IPC分类号和地区这些信息吗?

我记得ipc分类有个专门的网页入口,可以一层层进入进行采集。你进入的入口网页是哪一个?
举报 使用道具
bi_hang 新手上路 发表于 2019-1-31 14:46:50 | 显示全部楼层
Fuller 发表于 2019-1-30 22:37
我记得ipc分类有个专门的网页入口,可以一层层进入进行采集。你进入的入口网页是哪一个?
...

就是在高级检索里面检索地区和IPC分类
举报 使用道具
Fuller 管理员 发表于 2019-1-31 17:04:43 | 显示全部楼层
bi_hang 发表于 2019-1-31 14:46
就是在高级检索里面检索地区和IPC分类

你得预先知道地区和ipc分类号,用集搜客爬虫做一个连续动作规则,至少三个步骤:
1,输入地区
2,输入ipc号
3,点击提交
请参考高级教程中的连续动作教程:https://www.gooseeker.com/tuto/tutorial.html ,左栏菜单展开能找到很多教程
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 04:51