为集搜客分词和情感分析扩展模块安装情感分析模型库的方法 ... ...

2026-1-5 16:44| 发布者: Fuller| 查看: 82| 评论: 0

摘要: 集搜客分词和情感分析软件是一个在线软件平台,但是随着功能扩展,尤其引入机器学习和深度学习成立能力时,在线平台难于支持,所以,以扩展模块的方式提供聚类、LDA主题分析等功能 ...

1. 说明

集搜客分词和情感分析软件是一个在线软件平台,但是随着功能扩展,尤其引入机器学习和深度学习成立能力时,在线平台难于支持,所以,以扩展模块的方式提供聚类、LDA主题分析等功能。从分词扩展模块V4版本开始,增加了中英文双语的分词功能,而且分词器同时使用jieba和spacy,以便用户对比效果,同时利用spacy的英文分词和词性标注功能,让集搜客分词和情感分析可以同时支持中文和英文的文本分析。

同时,情感分析增加了基于深度学习技术分析英文或中文文本的能力。但是,深度学习需要的模型库十分大,最小的也超过1G。所以,模型库并不随软件一起发布和安装,而是根据需要另外安装。

我们选择了一个尺寸比较小的蒸馏过的开源的中英文双语情感分析模型,在Hugging Face上评价较高。如果用户有更好的模型推荐,可以告诉我们。

2. 需要安装情感分析模型的提示

进入中英文分词,选择顶部情感分析菜单,在情感分析页面上点击启动分析按钮,会弹出下图的提示框,表示没有安装情感分析模型

假设你登录电脑的时候使用了账号名work,而且也没有在集搜客数据管家上修改过数据库存放位置,那么就会在c:\Users\work目录中创建一个文件夹GooSeekerTag,这个文件夹中存放了分词扩展模块的所有程序、数据文件、日志和数据库。其中有个文件夹,名字是models。就需要在这个文件夹中放上情感分析模型,才能使用基于深度学习的情感分析功能。

3. 下载情感分析模型

进入集搜客QQ群(有多个群,进入其中任何一个即可,例如:472442022),在群文件中可以看到情感分析模型文件夹。如下图,不要进入这个文件夹,而是在文件夹这里点击下载,这样就省的一个个去下载所有这些文件了。

下载下来以后,进入情感分析模型文件夹,可以看到有15个压缩文件,每个文件名字后面都有一个编号。如果没有看到编号,可能是你的文件夹没有显示文件名后缀,可以在AI(比如,deepseek)上询问“在windows电脑上,怎样让文件名后缀显示出来?”,按照说明把文件名后缀显示出来。

4. 解压

因为情感分析模型很大,虽然选用了一个蒸馏后的小体积模型,也超过了1G大小。所以,为了下载方便,分卷压缩的,压缩成了15个zip文件(也叫卷)。解压时只需要解第一个zip文件就可得到整个情感分析模型。建议使用7-zip开源且免费软件,切记到其官网下载,防止别的分发渠道加入了不良功能。点击本链接即可进入7-zip官网下载软件

解压出来会看到生成了一个文件夹,名字是:multilingual_lxyuan

5. 部署情感分析模型

拷贝整个文件夹(名字是multilingual_lxyuan)。进入GooSeekerTag文件夹(看前面的图2)。如果没有修改过数据库位置,那么该文件夹就在 c:\Users\登录用户名\GooSeekerTag。进入models文件夹,执行粘贴操作,就会把刚才拷贝的multilingual_lxyuan文件夹放到了models中。

再去执行情感分析,就可以运行了。最终的目录结构如下图:


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2026-1-7 00:20