GooSeeker分词和情感分析软件的基础上,扩展了文本聚类分析和主题分析功能,其中主题分析提供了两个主题模型NMF和LDA供用户选择。

这些扩展功能都是用Python编程的,使用了一系列Python程序包,例如,数据挖掘和机器学习方面的数据包sklearn、数据处理方面的pandas和numpy等、可视化方面的matplotlib和pyLDAvis等,这些程序包必须安装在需要的位置,python程序才能正确运行。

1. 安装在什么位置呢?

Python运行在电脑上配置多个虚拟运行环境。因为不同的项目需要不同的程序包,为了避免版本冲突和精简维护要求,可以建立多个虚拟环境,也可能安装了多套Python。比较常见的是:在电脑上已经安装了一个纯粹的Python,又因为工作学习需要,安装了Anaconda套件,这就有了两个Python。除此以外,还可能安装别的软件的时候,创建了更多Python虚拟环境。

上面说的安装配套的Python程序包,就存在一个安装在哪个虚拟环境中的问题。如果安装了多个Python,执行哪个Python的pip命令就给那个Python安装程序包;如果创建了多个Python虚拟环境,那么在哪个激活的虚拟环境中执行其pip命令就给那个虚拟环境安装程序包。所以,常见的一个问题清楚了:

2. 为什么我按照提示安装了程序包,执行聚类分析和LDA分析的时候依然说没有安装成功?

这是因为,你可能把程序包安装在Anaconda环境中了(也可能是另外一个环境)。

3. GooSeeker扩展功能需要的环境

Windows操作系统:在系统环境变量中有一个Path变量,看这个变量中存储了哪个Python安装位置,就用那个位置的pip3程序执行安装。这里强调pip3,因为你的电脑上可能同时还安装了Python2这些低版本,我们一定需要Python3,而且需要3.9及其以上。
假设Python3.9的安装位置是D:\python39,那么要这样执行安装程序包的命令(下面的命令并没有明确指明pip3的位置,因为假定在系统环境变量path中已经规定了d:\python39\Scripts\这个位置):
    pip3 install -U pandas openpyxl loguru python-docx pyinstaller PyPDF2 xlrd scikit-learn jieba matplotlib pyLDAvis

MacOS操作系统:我们固定使用确定的安装位置:/usr/bin下的python3和pip3,所以要这样执行安装程序包的命令
    /usr/bin/pip3 install -U pandas openpyxl loguru python-docx pyinstaller PyPDF2 xlrd scikit-learn jieba matplotlib pyLDAvis

举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2025-2-25 10:20

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-3-28 17:20