思考大数据---“大数据都是骗人的啊! ”| 小故事
发布时间:2022-12-07 10:48:19 所属栏目:大数据 来源:
导读: 随着各种技术发展很多人都在吹捧大数据。然而如同股市一样越是高涨越是需要警醒在大数据热火朝天前行的路上多一点反思多一份冷静或许能让这路走的更好、更远。本文的10个小故事或许能让你有所得。
自201
自201
|
随着各种技术发展很多人都在吹捧大数据。然而如同股市一样越是高涨越是需要警醒在大数据热火朝天前行的路上多一点反思多一份冷静或许能让这路走的更好、更远。本文的10个小故事或许能让你有所得。 自2011年以来大数据旋风以“迅雷不及掩耳之势”席卷中国。毋庸置疑大数据已然成为继云计算、物联网之后新一轮的技术变革热潮不仅是信息领域经济、政治、社会等诸多领域都“磨刀霍霍”向大数据准备在其中逐得一席之地。 中国工程院李国杰院士更是把大数据提升到战略的高度他表示数据是与物质、能源一样重要的战略资源。从数据中发现价值的技术正是最有活力的软技术在数据技术与产业上的落后将使我们像错过工业革命机会一样延误一个时代。在这样的认知下“大数据”日趋变成大家“耳熟能详”的热词。 在大数据热炒之中大数据的价值是否被夸大了是否存在人造的“心灵鸡汤”大数据技术便利带来的“收之桑榆”是否也存在自己的副作用——“失之东隅”——个人的隐私何以得到保障大数据热炒的“繁华过尽”,数据背后的巨大价值是否还能“温润依旧”在众声喧哗之中我们需要冷静审慎地思考上述问题。 太多的“唐僧式”的说教会让很多人感到无趣。下文分享了10个从“天南地北”收集而来的小故事或称段子从这些小故事中可对热炒的大数据反思一下这或许能让读者更加客观地看待大数据。有些小故事与结论之间的对应关系或许不是那么妥帖诸位别太较真读一读、乐一乐、想一想就好. 大数据都是骗人的啊——大数据预测得准吗? 从前有一头不在风口长大的猪。自打出生以来就在猪圈这个世外桃源里美满地生活着。每天都有人时不时地扔进来一些好吃的东西小猪觉得日子惬意极了高兴任性时可在猪圈泥堆里打滚耍泼。忧伤时可趴在猪圈的护栏上看夕阳西下春去秋来岁月不争。“猪”生如此夫复何求 根据过往数百天的大数据分析小猪预测未来的日子会一直这样“波澜不惊”地过下去直到它从小猪长成肥猪……在春节前的一个下午一次血腥的杀戮改变了猪的信念尼玛大数据都是骗人的啊……惨叫嘎然而止。 球球大作战守护天使升级材料_大数据产业成为内蒙古产业转型升级新引擎_大守护者升级数据 图2 大数据预测都是骗人的 这则“人造寓言”是由《·人生元编程》一书作者池建强先生“杜撰”而成的。池先生估计是想用这个搞笑的小寓言“黑”一把大数据。 我们知道针对大数据分析无非有两个方面的作用1面向过去发现潜藏在数据表面之下的历史规律或模式称之为描述性分析 面向未来对未来趋势进行预测称之为预测性分析 。把大数据分析的范围从“已知”拓展 到了“未知”从“过去” 走向 “将来”这是大数据真正的生命力 和“灵魂” 所在。 那头“悲催”的猪之所以发出“大数据都是骗人的啊”呐喊是因为它的得出了一个错误的“历史规律”根据以往的数据预测未来它每天都会过着“饭来张口”的猪一般的生活。但是没想到会发生“黑天鹅事件”——春节的杀猪事件。 黑天鹅事件Black Swan Event) 通常是指难以预测的但影响甚大的事件一旦发生便会引起整个局面连锁负面反应甚至颠覆。读者可阅读纳西姆·尼古拉斯·塔勒布 Taleb所著的畅销书《黑天鹅》来获得对“黑天鹅事件”更多的理解。 其实我们不妨从另外一个角度来分析一下这个搞笑的小寓言在“黑”大数据时也有失败的地方。通过阅读知道舍恩伯格教授在其著作《大数据时代》的第一个核心观点就是大数据即全数据即n=All这里n为数据的大小其旨在收集和分析与某事物相关的“全部”数据而非仅分析“部分”数据。 那头小猪仅仅着眼于分析它“从小到肥”成长数据——局部小数据而忽略了“从肥到没”的历史数据。数据不全结论自然会偏预测就会不准。 要不怎么会有这样的规律总结呢“人怕出名猪怕壮”。猪肥了,很容易先被抓来杀掉。这样的“猪”血泪史天天都上演的还少吗上面的小寓言其实是告诉我们数据不全不仅坑爹还坑命啊。 那么问题来了大数据等于全数据即n=All能轻易做到吗? 请大家期待大守护者升级数据,《思考大数据“对不起'n=All'只是一个幻觉"》 作者简介:张玉宏博士,2012年毕业于电子科技大学现执教于河南工业大学。中国计算机协会CCF会员ACM/IEEE会员,埃文科技高级技术顾问。主要研究方向为高性能计算、生物信息学主编有《Java从入门到精通》一书。 (编辑:草根网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐


浙公网安备 33038102330473号