本研究使用信息提取工具包GooSeeker,挖掘突发事件的网媒报道数据,获得突发事件网络舆情的散点图。利用基于最小二乘法的多项式拟合法,获取各种舆情数据的拟合函数,并以近年来的突发事件作为相关案例进行实证分析。研究表明,根据各网络舆情的函数特征,其演化模式可分为突发型、连续型和复合型等,该方法能够有效地揭示突发事件网络舆情的演化过程和演化规律,为突发事件网络舆情的实时应对提供理论基础。 1. 论文范例介绍 标题:基于最小二乘法的突发事件网络舆情演化规律研究 作者: 曹学艳1 宋彦宁2 刘海涛3 李仕明4 1. 电子科技大学图书馆 2. 电子科技大学政治与公共管理学院 3. 电子科技大学微电子与固体电子学院 4. 电子科技大学经济与管理学院 关键词:突发事件;网络舆情;演化;最小二乘法; 摘要:利用信息提取工具包GooSeeker中的抓取规则编辑器MetaStudio和页面信息抓取工具DataScraper等分工合作,挖掘突发事件的网媒报道数据,获得突发事件网络舆情的散点图。利用基于最小二乘法的多项式拟合法,获取各种舆情数据的拟合函数,并以近年来的突发事件作为相关案例进行实证分析。研究表明,根据各网络舆情的函数特征,其演化模式可分为突发型、连续型和复合型等,该方法能够有效地揭示突发事件网络舆情的演化过程和演化规律,为突发事件网络舆情的实时应对提供理论基础。 2. 相关知识 2.1 如何理解最小二乘法 最小二乘法是用来做函数拟合或者求函数极值的方法。在机器学习,尤其是回归模型中,最常用的就是最小二乘回归求解模型参数。 3. 怎样获取更多的新闻舆情数据 本案例主要针对互联网上的舆情进行研究,关注的网络媒体主要指基于网络平台的新闻网站,如新浪、搜狐、腾讯等。考虑百度新闻搜索是全球最大的中文新闻平台,本文选择百度新闻搜索作为媒体关注度的数据搜集平台,挖掘该事件的新闻报道量。 要获得更多的新闻数据,可以使用GooSeeker新闻采集快捷工具,输入网址或者关键词,启动采集,采集完成后直接导出数据: |