在GooSeeker分词和情感分析软件的基础上,扩展了文本聚类分析和主题分析功能,其中主题分析提供了两个主题模型NMF和LDA供用户选择。
这些扩展功能都是用Python编程的,使用了一系列Python程序包,例如,数据挖掘和机器学习方面的数据包sklearn、数据处理方面的pandas和numpy等、可视化方面的matplotlib和pyLDAvis等,这些程序包必须安装在需要的位置,python程序才能正确运行。
1. 安装在什么位置呢?
Python运行在电脑上配置多个虚拟运行环境。因为不同的项目需要不同的程序包,为了避免版本冲突和精简维护要求,可以建立多个虚拟环境,也可能安装了多套Python。比较常见的是:在电脑上已经安装了一个纯粹的Python,又因为工作学习需要,安装了Anaconda套件,这就有了两个Python。除此以外,还可能安装别的软件的时候,创建了更多Python虚拟环境。
上面说的安装配套的Python程序包,就存在一个安装在哪个虚拟环境中的问题。如果安装了多个Python,执行哪个Python的pip命令就给那个Python安装程序包;如果创建了多个Python虚拟环境,那么在哪个激活的虚拟环境中执行其pip命令就给那个虚拟环境安装程序包。所以,常见的一个问题清楚了:
2. 为什么我按照提示安装了程序包,执行聚类分析和LDA分析的时候依然说没有安装成功?
这是因为,你可能把程序包安装在Anaconda环境中了(也可能是另外一个环境)。
3. GooSeeker扩展功能需要的环境
Windows操作系统:在系统环境变量中有一个Path变量,看这个变量中存储了哪个Python安装位置,就用那个位置的pip3程序执行安装。这里强调pip3,因为你的电脑上可能同时还安装了Python2这些低版本,我们一定需要Python3,而且需要3.9及其以上。
假设Python3.9的安装位置是D:\python39,那么要这样执行安装程序包的命令(下面的命令并没有明确指明pip3的位置,因为假定在系统环境变量path中已经规定了d:\python39\Scripts\这个位置):
pip3 install -U pandas openpyxl loguru python-docx pyinstaller PyPDF2 xlrd scikit-learn jieba matplotlib pyLDAvis
MacOS操作系统:我们固定使用确定的安装位置:/usr/bin下的python3和pip3,所以要这样执行安装程序包的命令
/usr/bin/pip3 install -U pandas openpyxl loguru python-docx pyinstaller PyPDF2 xlrd scikit-learn jieba matplotlib pyLDAvis
|
|
|
|
|
共 0 个关于本帖的回复 最后回复于 2025-2-25 10:20