通过集搜客爬虫采集了国务院历年的政策文件,想根据已发生的历史事件结合政策文件,通过分词工具分析出某个事件应对的具体政策,通过分词工具可以实现吗?


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-3-13 09:25

沙发
Fuller 管理员 发表于 2020-3-12 10:24:23 | 只看该作者
你这个研究课题太高大上了。我看到讲内容分析的书里面常常拿几十年来美国国情咨文做内容分析和文本分析。另外,政策的量化分析好像是一个专门的研究方向。

我们在设计集搜客分词和文本分析工具的时候做了一些调研,希望集搜客软件能适合这些研究领域的使用
举报 使用道具
板凳
ym 版主 发表于 2020-3-12 11:05:47 | 只看该作者
本帖最后由 ym 于 2020-3-12 11:07 编辑

可以试试集搜客分词和文本分析的分类管理功能,应该可以满足这个处理需求。操作步骤如下
1、把历史事件的专有名词整理出按事件分类的特征词库
2、把这个分类词库导入到集搜客分词和文本分析平台的“分类管理”里,启动分类匹配,它就会把文本和分类词语做标签匹配
3、然后把匹配结果导出来,就能看到指定历史事件对应了哪些文本,这就把政策文本按历史事件做好分类了
4、再把这些文本按事件主题另建多个分词任务,到这里就可以分别对每个历史事件的政策文本做分词、筛选高频词的处理了,后续就可以对比分析各个历史事件的相关政策特征
举报 使用道具
地板
微舆情 高级会员 发表于 2020-3-12 14:25:20 | 只看该作者
昨天论坛里有个金融分析的帖子, 其中有个例子是分析政策工具的,觉得和你这个分析有点相似
举报 使用道具
5#
王建国 高级会员 发表于 2020-3-13 09:25:04 | 只看该作者
感谢各位的指教,我试一下,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-23 19:59