近几年,学术APP发展很快。用户对 APP 的评论是其体验的真实反馈, 评论中蕴含着用户的体验感受、功能请求和错误报告等信息。用户评论数据具有数据量大、非结构化等特点,因此从这些评论中提取用户需求观点是一项巨大的挑战。针对学术APP评论数据特征,如何挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。今天分享的这篇研究范例,首先基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。 1,范文信息介绍 题目: 学术APP用户在线评论主题语义关联研究 作者: 王欣研 张向先 张莉曼 作者单位:吉林大学管理学院 关键词:学术APP;用户评论;主题识别;语义关联; 发表日期: 2020-06-01 基金资助: 国家社会科学基金项目“大数据驱动下学术新媒体知识聚合及创新服务研究”(18BTQ085); 摘要: 【目的/意义】 针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取用户需求和关注点提供思路和指导方法。 【方法/过程】 首先,基于LDA主题模型和GloVe词向量模型构建学术APP用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。 【结果/结论】 实验结果表明运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术APP平台运营者完善平台功能提供参考和借鉴。 文章目录 1相关研究 1.1学术APP的概念和特点 1.2 APPP用户评论挖掘 1.3虚拟社区用户评论主题识别 1.4虚拟社区评论语义关联研究 1.5学术APP用户在线评论主题语义关联的提出 2研究方法与框架 2.1研究方法 2.1.1 LDA主题模型 2.1.2 GloVe词向量模型 2.2学术APP在线评论主题语义关联研究框架 3实验过程 3.1数据收集与预处理 3.2基于基于LDA主题识别 3.3基于词向量模型扩充主题词 3.4主题图谱构建 3.5结论与建议 4结语 2,主要研究步骤,研究工具和相关知识点 2.1 本研究在线评论主题图谱构建实验的主要步骤 1. 数据采集与预处理,批量采集超星移动图书馆APP用户评论数据4522条。 2 对采集到的评论进行分词 3. LDA主题识别 4. 基于词向量模型扩充主题词 5. 主题图谱构建 2.2 收集产品在线评论使用什么工具? 在之前的一篇文章《分析电商评论发现消费者话题-数据采集篇》中,我们和大家分享了怎样使用gooseeker的快捷采集,收集电商产品的在线评论信息(实际抓取了京东,天猫,苏宁这3家的自营iphone12的用户评论),为进一步的数据挖掘分析实践做准备。 以速卖通为例,gooseeker快捷采集有好几个快捷采集工具可以直接使用: 1. 速卖通商品评论 2. 速卖通商品搜索列表 3. 速卖通商品问答数据采集 4. 速卖通商品详情_图片下载 5. 速卖通商品详情 这些快捷采集可以配合使用,添加网址启动采集即可,完成后打包下载excel数据表。 2.3 在线评论数据挖掘方法 GooSeeker会不定期发布一些电商评论采集和分析相关的文章以及学术研究论文,供大家参考学习。GooSeeker还会把典型的数据挖掘算法用Python实现,并以Jupyter Notebook的方式共享给大家,大家下载以后可以在上面增加更多分析处理过程: 3. 分析电商评论发现消费者话题-LDA主题分析篇(Jupyter Notebook) 4. 分析电商评论发现消费者话题-生成走势图(Jupyter Notebook) 3,本范例的研究总结 本文提出了学术 APP 在线评论主题语义关联研究方法,该方法应用便捷,实验数据可获取性强,能够识别用户关注主题且能深层次挖掘主题关联关系,为学术 APP 平台运营者提高服务水平,完善平台功能提供了可靠依据。具体来说有以下优势: ①从评论出发挖掘数据,角度新颖,方法便捷,可全面获取评论语义关系,分析用户需求和关注点更加客观有效; ②主题可视化展示相比以往的单纯表格展示更为直观清晰,便于快速聚焦话题,寻求主题关系和发现隐含主题; ③由于信息表达本身的模糊性和不确定性,用户以显性方式通过在线评论明确自己需求和观点不够充分,但是通过对多用户大量评论数据的整合,可较为准确分析用户需求和观点态度;④本文思路方法在解决大数据驱动下,从非结构化客观评论数据中挖掘用户关注主题及主题间关联关系有很好的借鉴意义。 |