我想练习一下基于微博评论的数据分析方法和过程,先找学长做的毕设和学位论文,模仿着演练数据分析技能。 1,案例寻找 微博因为信息丰富、多样且开放,且每时每刻都在产生“新鲜”的数据, 是最佳的数据渠道,基于微博上的各种数据做分析,也是每年大学生毕业论文的热门方向。 最近在学习怎样做基于微博数据的分析, 想找一些相关的分析案例作为参考,在知网上找到了这篇《智媒语境下网民对AI换脸技术的风险感知研究》。 研究对象主要以AI 换脸事件引发的舆情讨论文本为主,其中国内以App“Zao”为具体的分析对象,数据来源于社会化媒体微博。 本研究采用Gooseeker软件,以“Zao”为关键词采集到7342 条微博评论。数据清洗后,做分词和情感分析,主题聚类。 2,案例信息 题名:智媒语境下网民对AI换脸技术的风险感知研究 作者:孙强(上海大学新闻传播学院) 关键词:人工智能; AI换脸; 技术伦理; LDA; Snownlp; 摘要: "ZAO"和"Deepfake"两款基于深度学习技术的应用程序,激起了人们对AI换脸技术的广泛参与和讨论,同时也引发人们对人工智能时代的技术伦理风险的思考。现实问题反映出智能媒体语境下技术风险的治理体系急需转型。研究以Gooseeker收集文本数据,并应用Python计算编程来对文本进行处理和分析。研究发现,网民面对同一种类型化的技术伦理风险会有不同,主要表现为风险感知差异化、话语主题结构差异化、情感倾向差异化。面对智能化时代的技术伦理规制问题,其治理体系应进行思维转变,同时通过数字化素养教育来构建人在技术风险面前的主体性。 3,分析步骤和相关知识 3.1 本案例微博数据采集和分析的思维导图 图片来源:《智媒语境下网民对AI换脸技术的风险感知研究》 4,后续的学习实践 继续微博数据分析实践。之前已经学习和实践过几个案例, 基本步骤是这样: 1. 先用gooseeker微博工具箱针对某个话题采集一些微博关键词数据和微博评论数据 2. 然后使用gooseeker文本分词和情感分析软件进行分词,基于词频统计的分析, 情感分析 |