天眼查,公司名爬下来都是其他字,如何解决啊?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2019-4-11 16:10

沙发
Fuller 管理员 发表于 2019-4-11 15:43:54 | 只看该作者
集搜客网络爬虫从V9.0.0开始就能下载自定义字体文件,并将网页上的特殊字体内码存下来。但是需要自己利用内容去查字体文件得到一个字,并且翻译成utf-8或者其他编码的字。这个翻译过程我们没有公开
举报 使用道具
板凳
ovna123 金牌会员 发表于 2019-4-11 15:52:54 | 只看该作者
v9版在哪个位置手工查找?
举报 使用道具
地板
Fuller 管理员 发表于 2019-4-11 16:01:06 | 只看该作者
ovna123 发表于 2019-4-11 15:52
v9版在哪个位置手工查找?

要用其他的字库查看工具,爬虫没有字库查看功能,爬虫只管下载
举报 使用道具
5#
ovna123 金牌会员 发表于 2019-4-11 16:03:46 | 只看该作者
是你们的,还是第三方的,我在哪能找到?
举报 使用道具
6#
Fuller 管理员 发表于 2019-4-11 16:07:22 | 只看该作者
ovna123 发表于 2019-4-11 16:03
是你们的,还是第三方的,我在哪能找到?

在网络上能搜到,有很多解决方案,去搜索那些公开的解决方案就行,大家做的基本上都一样
举报 使用道具
7#
ovna123 金牌会员 发表于 2019-4-11 16:10:45 | 只看该作者
好的,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 17:37