这一段时间我们分享了几个关于微博和电商评论的分析案例给大家,在介绍案例的同时也讲解了怎样通过GooSeeer网络爬虫软件和文本分词和情感分析软件获取更多的数据,进行文本分析和情感分析。 今天给大家分享一个政策文本分析的案例,这个研究选取政府公报作为政策文件的研究样本,为最大限度地获取相关研究样本,采用多种检索收集数据策略: 1. 在各省市政府门户网站中查找发布或公开的相关政府公报文本; 2. 选择“北**宝”、“北**意网”等专业政策数据库,利用检索词“政府”、“数据”、“开 放”进行组配检索; 3. 利用百度、Google 等搜索引擎进行检索,查缺补漏。 和微博及电商评论相比,政策文本所在的网页结构一般不统一,收集数据的过程会比较费力。正文内容可以使用GooSeeker网络爬虫大批量采集,正文中分散在文字中的关键概念和名称可以使用GooSeeker的另一个工具获取:集搜客报表摘录软件,用来收集这种非结构化,较零散的网页可以显著提高效率,同学们可以试试。 1,案例简介 研究以政府开放数据公报为样本,从时间演化、部门主体、政策类型方面梳理了我国政府开放数据政策实施的总体现状;基于政策工具理论和政策科学视角,从政策工具维度和政策主题维度构建了政策实施阶段分析的理论框架;运用TF-IDF算法和LDA模型识别了政策实施中的保障措施和政策目标,构建了政府开放数据政策的实施框架。结合政策实施阶段的现状、特点和问题,提出对策与建议,以促进国家政府开放数据政策体系的完善。 研究框架示意图如下: 2,研究方法 本研究侧重于政府开放数据政策实施阶段的政策主题内容和政策工具研究,采用的研究方法分别为内容分析法和政策工具理论。 2.1,内容分析法 内容分析法用于对文本资料进行分类和降维,常用方法包括 LDA (latent Dirichlet allocation) 主题分析法、共词分析法、聚类分析法和网络分析法等,其中以 LDA 主题模型尤为突出。本研究使用了LDA主题分析法。 2.2,政策工具理论 政策工具理论在政策文本分析中的应用主要包括两个方面:①对政策工具类型进行选择;②以政策工具为基本分析维度的多维分析框架的建立,其多维度主要为结合政策目标和所研究政策本身特性等方面内容。 3,案例详情 标题:我国政府开放数据政策的实施现状和特点研究_基于政府公报文本的量化分析 作者:华中师范大学信息管理学院 陈玲;湖北省数据治理与智能决策研究中心 段尧清 关键词:政府开放数据;政策实施;政策工具;政策文本分析 摘要: 政策实施处于政策制定和政策评价等环节之间的位置,梳理我国政府开放数据政策实施阶段的现状、特点,是揭示政策价值、识别政策取向、预防政策失灵的有效途径。研究以政府开放数据公报为样本,从时间演化、部门主体、政策类型方面梳理了我国政府开放数据政策实施的总体现状;基于政策工具理论和政策科学视角,从政策工具维度和政策主题维度构建了政策实施阶段分析的理论框架;运用TF-IDF算法和LDA模型识别了政策实施中的保障措施和政策目标,构建了政府开放数据政策的实施框架。结合政策实施阶段的现状、特点和问题,提出对策与建议,以促进国家政府开放数据政策体系的完善。 政府开放数据政策实施的理论分析框架示意图: |