集搜客GooSeeker网络爬虫

标题: 使用集搜客分词工具分析国务院政策文件 [打印本页]

作者: 王建国    时间: 2020-3-12 10:18
标题: 使用集搜客分词工具分析国务院政策文件
通过集搜客爬虫采集了国务院历年的政策文件,想根据已发生的历史事件结合政策文件,通过分词工具分析出某个事件应对的具体政策,通过分词工具可以实现吗?
[attach]12032[/attach]


作者: Fuller    时间: 2020-3-12 10:24
你这个研究课题太高大上了。我看到讲内容分析的书里面常常拿几十年来美国国情咨文做内容分析和文本分析。另外,政策的量化分析好像是一个专门的研究方向。

我们在设计集搜客分词和文本分析工具的时候做了一些调研,希望集搜客软件能适合这些研究领域的使用
作者: ym    时间: 2020-3-12 11:05
本帖最后由 ym 于 2020-3-12 11:07 编辑

可以试试集搜客分词和文本分析的分类管理功能,应该可以满足这个处理需求。操作步骤如下
1、把历史事件的专有名词整理出按事件分类的特征词库
2、把这个分类词库导入到集搜客分词和文本分析平台的“分类管理”里,启动分类匹配,它就会把文本和分类词语做标签匹配
3、然后把匹配结果导出来,就能看到指定历史事件对应了哪些文本,这就把政策文本按历史事件做好分类了
4、再把这些文本按事件主题另建多个分词任务,到这里就可以分别对每个历史事件的政策文本做分词、筛选高频词的处理了,后续就可以对比分析各个历史事件的相关政策特征[attach]12036[/attach]

作者: 微舆情    时间: 2020-3-12 14:25
昨天论坛里有个金融分析的帖子, 其中有个例子是分析政策工具的,觉得和你这个分析有点相似
作者: 王建国    时间: 2020-3-13 09:25
感谢各位的指教,我试一下,谢谢!




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2