今天分享的这篇研究论文范例,以 “豆瓣小组”为例进行实证研究,通过对网络社群的深入分析,发现社群特征可根据社群话题及用户兴趣予以表征。首先,利用主题提取BTM模型对网络社群话题进行主题模型训练,从而得到网络社群话题预标签; 其次,根据社群成员兴趣标签网络中不同类型的重要节点指标,利用TOPSIS多指标综合评价方法挖掘成员整体兴趣,从而得到网络社群成员兴趣预标签。 做研究写论文,如果需要采集豆瓣数据,直接使用GooSeeker豆瓣数据快捷采集,添加网址启动采集即可。采集完成后,直接打包下载excel文件用于后续的研究。 1,研究范文信息介绍 标题:网络社交平台中社群标签生成研究 作者: 蒋武轩 易明 熊回香 童兆莉 华中师范大学信息管理学院 武汉 430079 关键词:社群标签 标签生成 BTM TOPSIS 摘要: [目的/意义] 基于网络社交平台中社群话题及用户兴趣挖掘而生成的社群标签,能够提高社群定义的及时性与 准确性,解决用户信息获取、网络社群选择的困难。 [方法/过程]通过对网络社群的深入分析,发现社群特征可根据社群话题及用户兴趣予以表征。首先,利用主题提取BTM模型对网络社群话题进行主题模型训练,从而得到网络社群话题预标签; 其次,根据社群成员兴趣标签网络中不同类型的重要节点指标,利用TOPSIS 多指标综合评价方法挖掘成员整体兴趣,从而得到网络社群成员兴趣预标签。综合两者结果生成社群标签并进行优化,且以 “豆瓣小组”为例进行实证。 [结果/结论]基于社群话题及成员兴趣的社群标签生成模型能够准确地挖掘主要兴趣及近期关注点,社群整体的标签生成有利于网络用户兴趣群体的选择。 文章目录 1 引言 2 社群标签生成模型 2.1 社群话题标签子模型 2.2 社群活跃成员兴趣标签子模型 2.2.1 兴趣标签网络生成 (1)资源-标签隶属矩阵。 (2)标签共现矩阵。 2.2.2 资源标签网络度量指标 (1)度数中心性。 (2)中介中心性。 (3)接近中心性。 (4)特征向量中心性。 2.2.3 社群成员兴趣预标签 2.3 社群标签生成 3 实证研究 3.1 数据收集与整理 3.2 社群话题标签生成 3.3 社群成员兴趣标签生成 3.3.1 用户兴趣标签网络构建 3.3.2 兴趣标签网络 3.3.3 标签网络重要节点指标计算 3.3.4 TOPSIS兴趣标签网络综合评价 3.4 社群标签生成 4 实证研究结果分析 5 结语 2,本范例主要研究方法和相关知识点 2.1,资源标签网络度量指标 2.1.1 度数中心性 GooSeeker资讯版块的文章《怎样利用集搜客的共词矩阵表计算点度中心性(Degree centrality)》,介绍了点度中心度相关的分析案例和使用python做点度中心度的计算实验。 2.1.2 中介中心性 GooSeeker资讯版块的文章《如何使用Jupyter Notebook计算中介中心度(betweenness centrality)》,介绍了中介中心度相关的分析案例和使用python做中介中心度的计算实验。 2.1.3 接近中心性 GooSeeker资讯版块的文章《怎样使用Jupyter Notebook计算接近中心度》,介绍了接近中心度相关的分析案例和使用python做接近中心度的计算实验。 2.1.4 特征向量中心性(eigenvector centrality) 参考文章《中心性的度量---度中心性,间接中心性,紧密中心性,特征向量中心性》的说明: 一个节点的特征向量中心性与其临近节点的中心性得分的总和成正比。与重要的节点连接的节点更重要,有少量有影响的联系人的节点其中心性可能超过拥有大量平庸的联系人的节点。计算方法为: 1、计算图的成对临近矩阵的特征分解 2、选择有最大特征值的特征向量 3、第i个节点的中心性等于特征向量中的第i元素 后续我们将在Jupyter Notebook中使用Python做特征向量中心性(eigenvector centrality)的计算实验。 3,本范例研究的成果 本研究所提出的模型将社群话题表征的社群长期特征与社群活跃成员兴趣标签表征的社群短期兴趣进行结合,能够较好地揭示社群关注的特点。对社群标签的动态生成能够提高网络社群定义的及时性与准确性,方便用户清楚地了解不同社群特点,解决用户获取信息、选择社群困难等问题。但是,由于豆瓣用户多是使用概括性或反映整体感受、评价的标签[15],因此在表征社群成员兴趣时有些标签的区分度不高,但依然能够依据现实情况及时地对社群成员兴趣予以表征。后续在数据更为合理的情况下,模型能够更准确及时地为社群生成表征其特点兴趣的标签。 |