什么是大数据?
关于大数据的概念,至今似乎也没有一个公认的说法。同样,对于大数据的理解和认识,也同样产生了各种各样的判断。
对于“大数据”(Big Data),研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别上看,“大数据”指的是无法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。
一提到大数据,人们通常用3个V来定义它,即Volume(数量)、Variety(种类)和速度(Velocity)。随着业界对大数据理解的深入,第四个V也浮出水面,Veracity(真实性)正在成为大数据的基本特征之一。在前不久IBM召开的2013年大数据发布会上,重点解析了IBM与牛津大学共同的大数据研究成果——《分析:大数据在现实世界中的应用》白皮书中也提出了,重新定义和完善大数据“4V”理论的方向。
IDC研究表明,包含结构化和非结构化的大数据正在以每年60% 的增长率持续增长,到了2020年全球数据总量将增长44倍,达到35.2ZB。国内知名大数据学者,电子科技大学计算机互联网中心主任周涛博士表示:‘大数据’一词已经无处不在,其被用于承载所有类型的概念,包括海量数据、实时数据、社交媒体分析、下一代数据管理能力等。对于企业来说,对大数据的理解不应仅仅局限于技术领域,而应成为一项业务上需要优先考虑的任务,因为它能够带来全球整合经济时代商业模式的巨大变革。业界已经从对大数据重要性的认识阶段,发展到实践大数据的必要性的战略实施阶段。
大数据为我们带来什么
大数据已被用于承载所有类型的概念,包括:巨量的数据、社交媒体分析、下一代数据管理能力、实时数据等。无论是任何种类,企业都已经开始理解并且探索如何以新的方式处理并分析大量的信息。
“对于企业来说,不管是大数据还是小数据,我们只关心一点:这些数据能不能帮助企业建立核心竞争力。”这句话或许真正道出了企业对待大数据等一些技术、概念的真实想法。
白皮书中显示:四分之三的受访者(76%)目前正在开展“大数据”项目开发工作,但报告证实,大部分受访者(47%)当前仍处于早期规划阶段,但同时也有28%的受访者正在开发试点项目或已经实施了两项甚至多项“大数据”解决方案。还有近四分之一(24%)的受访者尚未着手开展“大数据”活动,并且还在研究大数据对其组织究竟有何益处。
显而易见,“大数据”将带来蓬勃商机。近三分之二(63%)的受访者表示,合理运用数据并部署分析为其组织创造了竞争优势。在此次调查中,提及“竞争优势”的受访者比例与2010年IBM调查相比增加了70%(2010年比例为37%)。
大数据将为商业带来附加价值,带来创新、转型、变革似乎已经是不争的事实。
微软公司全球副总裁兼微软中国研发集团总裁张亚勤也撰文称《云和大数据有望催生颠覆式创新》。
电子科技大学计算机互联网中心主任周涛博士在大数据带来的创新上也类似观点:大数据实际给了中国一个机会,它能够更快地追赶英国、美国或者其他欧洲发达国家。如果就具体的中国市场来说,大数据不仅给中国市场,也包括技术国家的市场带来的最大的改变,或者是影响是深度创新。我们以前讲创新可能是小规模的,局部的创新,现在的创新真正是需要很深入地分析后得到的创新,这样才有更大的增值空间。
大数据时代,我们做什么
有一种说法,大数据是——董事会级别的话题,战略层面的思考。这充分说明了大数据之于企业的战略意义。当然,如果大数据只有理性的分析而没有智慧的落地,带不来增值可能还会适得其反。
震惊全国的长春偷车弑婴案,在德华安顾人寿董办主任王洪涛博士看来,如果让大数据有智慧的落地,也许有可能避免悲剧的发生。城市建了天网系统,几万个摄像头布置下去,形成了大数据集群,但因为没有智慧在里面,没有车牌号的识别系统,没有通过定位之后的运行轨迹系统,所以无法快速找到一辆车。光上硬件而没有智慧的大数据只能是数据的坟墓。
尽管宣传铺天盖地,但整个市场都同意,我们处于企业大数据采用的初级阶段。IBM关于大数据的调研显示:大多数企业目前处于大数据开发的早期阶段,大多数企业目前主要是理解概念(24%)或者定义与大数据相关的路线图(47%)。然而,28%的受访者属于领先的企业,他们正在进行概念验证测试,或者已经大规模实施了大数据解决方案。
白皮书显示:组织对大数据采用了一种务实的方法。最有效的大数据解决方案首先识别业务要求,然后定制基础架构、数据源和分析方法,以支持业务机会。这些组织从现有的和新的内部信息来源中获取新的洞察力,制订大数据技术战略,然后随着时间的推移逐步地升级相应的基础架构。
IBM的调研结果为各组织逐步开展大数据举措以及从大数据中获取最大的商业价值提供了五项关键建议:
·以客户为中心推动初始举措;
·制订整个企业的大数据蓝图;
·从现有数据开始,实现近期目标;
·根据业务优先级逐步建立分析能力;
·基于可衡量的指标制定业务投资回报分析。
最好的时代,最坏的时代?
《纽约时报》前阵子有篇文章,谈到了“大数据”不擅长的地方。大概可总结为以下几点:1、数据不懂社交;2、计算机数据分析擅长的是测量社会交往的“量”而非“质”;3、数据不懂背景;4、数据会制造出更大的“干草垛”;5、大数据无法解决大问题;6、数据偏爱潮流,忽视杰作;7、数据掩盖了价值观念!
这些是大数据的本身的缺憾还是对大数据的误读,在IBM软件集团大中华区中间件集团总经理李红焰女士看来,每个结论都出自不同的角度。大数据不是万能的,数据一定需要通过智慧的人和智慧的群体去解决问题。要把看不见的技术,变成看得见的享受。谈到人、情感、价值观等问题,她的感觉是,大数据时代有一个好处,它给了你更多的选择,看你更多看重什么。如果是企业,你要给企业一个什么样的未来。
在《“原始数据”只是一种修辞》中有这样一段表述:数据从来都不可能是“原始”的,数据总是依照某人的倾向和价值观念而被构建出来的。数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。
这也应该是大数据时代一个不可回避的问题。英国《金融时报》有一篇《Facebook透露你的“秘密”》的文章,其实说出了未来大数据时代的隐忧。一项覆盖面广的学术研究报告表明,电脑程序可以通过跟踪人们如何使用Facebook网站,来获取越来越多的个人信息。比如用户的性别、服药习惯、甚至这些用户年幼时父母是否离婚等私人信息……
这一研究凸显出人们对于社交网络以及通过挖掘数据特征获取敏感信息的担忧日益加深。即便在人们试图对个人信息保密的情况下,通过挖掘数据特征也能获得敏感信息。该报告的作者之一迈克尔·科辛柯西(Michal Kosinksi)表示:“我们使用的是十分简单而通用的方法。营销公司与互联网公司在这方面可能会花费更多时间和资源,因此它们所获信息的准确度比我们更高。”
因此我们也感受到,当大数据给我们带来前所未有的便利和分析、洞察之外,确实也给我们带来了不安全感甚至威胁,这也造成了大数据时代的管理变革和社会约束的变革,这在维克托·迈尔舍恩伯格和肯尼思·库克耶的《大数据时代》一书亦有所提及。
网址引用: 思谋资源组. 什么是大数据时代. 思谋网. https://www.scmor.com/view/1706.