集搜客爬虫软件可以穷尽式抓取信息吗?
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2017-3-2 11:56

沙发
ym 版主 发表于 2017-3-2 11:53:31 | 只看该作者
抓的越多,就需要越多电脑和网络,费钱,所以,要限定一个范围
你是想抓什么?

举报 使用道具
板凳
lyh123 初级会员 发表于 2017-3-2 11:54:10 | 只看该作者
比如说我现在要找全国医疗机构的组织代码,但是页面只会显示9页数据,只能通过细化关键字之类的方法去穷尽
细化关键字之类的方法我们不打算用人工ocr
举报 使用道具
地板
ym 版主 发表于 2017-3-2 11:54:25 | 只看该作者
还要ocr?不是文本?
举报 使用道具
5#
lyh123 初级会员 发表于 2017-3-2 11:54:39 | 只看该作者
这么说吧,就是在一个指定网站里找一类信息,用关键字穷尽式采集
举报 使用道具
6#
ym 版主 发表于 2017-3-2 11:54:48 | 只看该作者
这个网站有没有搜索功能?
举报 使用道具
7#
lyh123 初级会员 发表于 2017-3-2 11:54:55 | 只看该作者
举报 使用道具
8#
ym 版主 发表于 2017-3-2 11:56:20 | 只看该作者
集搜客爬虫能够帮你实现的事就是:连续输入功能,把一批关键词自动逐个输入,然后采集搜索结果
前提是你已经确定好这批用来搜索的关键词。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 16:48