• 标题:【GDELT项目大型数据集下载】#集搜客GooSeeker数据集开放目录#
  • 分类:科研学术
  • 关键词:新闻、社会事件、社会学、社会安全
  • 摘要:GDELT projectGoogle Jigsaw 支持的项目,GDELT项目监视全世界100多中语言的广播、印刷媒体和web信息,几乎覆盖全球任何角落。这是一个开放的计算平台,能计算识别出驱动全球社会活动的各方面要素。
  • 链接:http://gdeltproject.org/data.html

更多信息:
the GDELT Project monitors the world's broadcast, print, and web news from nearly every corner of every country in over 100 languages and identifies the people, locations, organizations, counts, themes, sources, emotions, counts, quotes, images and events driving our global society every second of every day, creating a free open platform for computing on the entire world.

这是一个极具价值的数据集,可用于文本挖掘、时间序列分析和预测模型建立,可能的应用范围举例:经济预测、股市黑天鹅事件捕捉、总统大选预测等。
可申请下载的数据集包含从1979年1月1日到2013年3月31日的所有事件,而且信息维度及其丰富。因为数据量太大,需要分时间段下载,1979年到2005年按照年度下载,从2006年1月开始月度下载。
                  




举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-11-23 09:54

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 13:00