• 标题:【GDELT项目大型数据集下载】#集搜客GooSeeker数据集开放目录#
  • 分类:科研学术
  • 关键词:新闻、社会事件、社会学、社会安全
  • 摘要:GDELT projectGoogle Jigsaw 支持的项目,GDELT项目监视全世界100多中语言的广播、印刷媒体和web信息,几乎覆盖全球任何角落。这是一个开放的计算平台,能计算识别出驱动全球社会活动的各方面要素。
  • 链接:http://gdeltproject.org/data.html

更多信息:
the GDELT Project monitors the world's broadcast, print, and web news from nearly every corner of every country in over 100 languages and identifies the people, locations, organizations, counts, themes, sources, emotions, counts, quotes, images and events driving our global society every second of every day, creating a free open platform for computing on the entire world.

这是一个极具价值的数据集,可用于文本挖掘、时间序列分析和预测模型建立,可能的应用范围举例:经济预测、股市黑天鹅事件捕捉、总统大选预测等。
可申请下载的数据集包含从1979年1月1日到2013年3月31日的所有事件,而且信息维度及其丰富。因为数据量太大,需要分时间段下载,1979年到2005年按照年度下载,从2006年1月开始月度下载。
                  




举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-11-23 09:54

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-17 19:50