资讯

大数据的问题08:谷歌流感预测是如何失效的
大数据的问题08:谷歌流感预测是如何失效的
这篇故事不再像上两篇那样言辞含有“负能量”,而是用一个案例提醒大数据工作者要注意“大数据傲慢”谷歌流感预测:预测是如何失效的? 2009年2月,谷歌公司的工程师们在国际著名学术期刊《自然》上发表了一篇非常 ...

2015-11-28 16:20

大数据的问题07:啤酒和尿布的故事是伪造的
大数据的问题07:啤酒和尿布的故事是伪造的
所谓“仁者见仁,智者见智”,大数据作为新生科技,会迷茫,会悲观,然而这向来是机会所在。这个系列故事开始几个还算容易牵动读者去思考探索,从上个故事《大数据的问题06:大数据预测得准吗?》开始,会让更多持怀 ...

2015-11-28 15:42

大数据的问题06:大数据预测得准吗?
大数据的问题06:大数据预测得准吗?
这个系列故事全部是反思大数据,每个故事都会给大数据玩家一种刺痛感,上一篇《点球成金——数据流PK球探,谁更重要?》虽然也在说大数据失效的故事,但是明确人掌握大数据的分析师的价值和地位。今天这个故事触及大 ...

2015-11-26 17:55

大数据的问题05:点球成金——数据流PK球探,谁更重要?
大数据的问题05:点球成金——数据流PK球探,谁更重要?
上个故事《盖洛普抽样的成功——大小之争》展示了大数据和小数据的PK,误差和偏差再次刺痛了我们大数据工作者的心。看今天的故事也许可以温暖一下我们受伤的心,数据及数据分析和分析师PK,让你找到勇士的感觉:数据 ...

2015-11-26 17:13

大数据的问题04:盖洛普抽样的成功——大小之争
大数据的问题04:盖洛普抽样的成功——大小之争
读了上一个故事《园中有金不在金——大数据的价值》才知道目前玩大数据的就像小蜜蜂,酿的蜜不足为题,产生的价值竟然主要是传粉。虽是无心插柳,总比白干强,先放一放吧,我们要探讨一个新问题:“大”数据一定胜过 ...

2015-11-25 21:44

大数据的问题03:园中有金不在金——大数据的价值
大数据的问题03:园中有金不在金——大数据的价值
上一个故事《大数据的问题02:颠簸的街道——“n=All”只是一个幻觉?》展现了全数据梦想及其数据偏差问题,让我们感受到:“n=All”,梦想很丰满,但现实很骨感!那么,大数据背后的价值到底在哪?园中有金不在金— ...

2015-11-25 18:46

大数据的问题02:颠簸的街道——“n=All”只是一个幻觉?
大数据的问题02:颠簸的街道——“n=All”只是一个幻觉?
第一个故事:《醉汉路灯下找钥匙——大数据的研究方法可笑吗?》反思了大数据研究方法问题,接下来我们看看所谓的大数据和全数据,价值在哪里?颠簸的街道——对不起,“n=All”只是一个幻觉 波士顿市政府推荐自己 ...

2015-11-25 10:38

大数据的问题01:醉汉路灯下找钥匙
大数据的问题01:醉汉路灯下找钥匙
涉足数据行业已经有10年了,今天被一篇文章所深深吸引:深度|十个段子反思大数据。《大数据带来的八个(不,是九个!)问题》(Eight (No, Nine!) Problems With Big Data)不只是标题党的作品,所说的第九个问题很 ...

2015-11-25 10:05

双十一未购物的年轻人群近一半是单身
双十一未购物的年轻人群近一半是单身
双十一未购物的年轻人群分析信息图谱显示,未购物人群近一半是单身汪。

2015-11-24 15:27

对抗恐怖主义,人工智能可以做什么?
对抗恐怖主义,人工智能可以做什么?
天网恢恢,与恐怖主义的战争还将继续下去,人工智能正与我们并肩作战。

2015-11-18 10:17

毕业论文写什么,集搜客告诉你——微博数据挖掘篇
毕业论文写什么,集搜客告诉你——微博数据挖掘篇
集搜客数据分析实验室采集了2010年至2015年11月有关微博数据挖掘的相关论文并对其进行分析,总结了微博数据挖掘论文的九大研究方向供学子们的选题做参考。 ... ... ...

2015-11-17 09:46

巴黎恐怖袭击背后的大数据
巴黎恐怖袭击背后的大数据
11月13日晚,巴黎市中心多地发生恐怖袭击,造成大量人员伤亡。黑色星期五,巴黎一夜惊魂,全世界为之悲痛。虽然远隔万里,但是身处中国的我们依然十分关注这次震惊世界的恐怖袭击活动。 ... ... ... ... ... ...

2015-11-16 11:25

为什么你的大脑那么喜欢图表?13张图告诉你
为什么你的大脑那么喜欢图表?13张图告诉你
一张好的信息图表读者当然会喜欢,我也不能撒谎去否认这一点,尤其是在数字营销的领域。但你是否考虑过背后的原因呢?

2015-11-12 10:15

大数据时代,数据科学的七大危险趋势
大数据时代,数据科学的七大危险趋势
本文来自北京大学新媒体研究院副院长刘德寰教授在CMRA第九届中国市场研究行业双年会的演讲。刘德寰教授介绍了数据科学的结构,即三个非常重要的层次:数据的获取、数据的描述和数据的分析,以及它面临的问题。 ... ...

2015-11-11 09:12

Yelp是如何使用深度学习对商业照片进行分类的
Yelp是如何使用深度学习对商业照片进行分类的
任何机器学习系统都不可能是完美的。Yelp表示,如果你想帮助提高Yelp照片分类的质量,请随意标注你看到的任何未分类的照片。

2015-11-10 11:34

GMT+8, 2024-11-23 17:01