本帖最后由 xandy 于 2016-11-25 16:04 编辑

  • 标题:【百度预测-网民行为数据】#集搜客GooSeeker数据集开放目录#
  • 分类:互联网
  • 关键词:百度预测,经济指数预测,景点预测,疾病预测
  • 摘要:包含如下几大版块,经济指数预测、景点预测、疾病预测、城市预测、欧洲赛事预测、世界杯预测、高考预测、电影票房预测(还没上线)。

更多信息:
百度经济指数的计算数据来自于覆盖国人达95%的百度搜索数据,这些海量数据蕴含了大量的企业需求和用户行为信息,能够映射企业和用户在实际生产、生活中的趋势和规律。


百度大数据部通过对搜索数据的深度挖掘,已经发现旅游相关词搜索数量和实际旅游 人数之间的密切关系,并依此建立了旅游预测模型。

流行病的发生和传播有一定的规律性,与气温变化、环境指数、人口流动等因素密切相关。每天网民在百度搜索大量流行病相关信息,汇聚起来就有了统计规律,经过一段时间的积累,可以形成一个个预测模型,预测未来疾病的活跃指数。

和景点预测是一样的,这里不多介绍。

我们用2010年南非世界杯的淘汰赛数据进行了模型准确性验证。我们为预测模型输入了2010年世界杯期间的比赛、球队、球员等相关数据(不包括真实结果数据),由预测模型输出淘汰赛比赛结果,然后用预测的结果与真实结果进行对比来计算预测的准确率。

我们用2010年南非世界杯的淘汰赛数据进行了模型准确性验证。我们为预测模型输入了2010年世界杯期间的比赛、球队、球员等相关数据(不包括真实结果数据),由预测模型输出淘汰赛比赛结果,然后用预测的结果与真实结果进行对比来计算预测的准确率。

基于用户的搜索行为对报考大学和专业进行预测。


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-11-7 09:08

沙发
verygood 初级会员 发表于 2016-11-6 22:48:59 | 只看该作者
什么意思???
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-7 09:08:20 | 只看该作者
有用的数据一起整理和分享
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 02:56