“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。”以上是百度百科给出的定义。
从自身出发对这个概念进行简单理解,大数据就是对涉及到生活中方方面面的数据量大的、数据种类多样的具有高价值的信息进行存储、分析和处理。
从某种程度上说,大数据时代已经降临了。目前互联网公司每天产生的数据量非常庞大,已经不能用G或T来衡量,以至于现在数据量的级别最高已经达到ZB(1ZB=1024EB=1024PB=1024TB)。想必随着以后大数据来袭的更加凶猛,再增加几个级别也不是太异想天开的事情。
在这个网络技术肆意蔓延的时代,所有人已经被卷入了一股名为大数据的龙卷风之中,身处这龙卷风的漩涡之中又有多少人明白大数据来袭,究竟意味着什么?
大数据 未来的新石油
在中国科协近日举办的科学家与媒体面对面活动上,中国某网络技术研究院首席专家给出一组直观数据来描绘了大数据的未来图景:到2030年,中国一个普通的家庭会有40~50个智能终端,一个家庭产生的数据是20TB,相当于半个国家图书馆的藏书容量,即2600万册,40TB。
“最近两三年产生的数据可能比人类历史上4万年产生的数据还要多,实际就是由于互联网的发展,互联网是大数据来源的最重要的地方。”该专家说,如果在一辆普通家用轿车上安装传感器,大约需要几十到近百只,而豪华轿车的传感器数量可达200余只。在传感器的监测之下,汽车每小时能产生5~250GB的数据,而谷歌的无人驾驶汽车每秒产生约1GB数据。而据IDC预测,到2020年,全球将有300亿个物联网终端,远超人类的数量。
这些庞大数字的价值堪比黄金,也可以说大数据就是未来的新石油。这位专家说:“数据已经成为一种新的经济资产类别,就像货币或黄金一样,将形成数据材料、数据探矿、数据加工、数据服务等一系列新兴产业。”正如《大数据时代》一书里所说的:知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。
“谷歌流感趋势”曾震撼世人。2009年2月,谷歌在《自然》杂志上发文,解释了谷歌仅仅通过研究人们上网的搜索记录,就能够预测季节性流感的爆发和传播。谷歌的预测与美国疾控中心的预测数据存在很高的相关性。但美国疾控中心通告新流感往往会有一两周的延迟,而谷歌的预测数据更有效、更及时。为此,谷歌公司处理了5000万条词条与将近5亿数学模型。
“要在数据里面找出有价值的东西来,这是大数据技术的核心,迅速完成数据价值的提纯。”这位专家说道。以监控摄影为例,有的监控累计一整天,其中真正有价值的可能只有“发现你干坏事的那一两秒钟”,在这中间怎么找出来,就是数据挖掘技术的关键。
数据加密 为海量信息安全撑起防护圈
当然,在利用大数据价值的同时,也须警惕数据安全和隐私保护问题。某互联网中心主任说,对于政策制定,原来对用户的隐私保护更多侧重于隐私本身,如个人姓名、电话号码、银行账号等,而大数据时代除了保护这些信息,更需要一些新的思路和方法,如果只是保护用户信息的采集环节,在大数据时代就是不完整的,因为总有一些其他信息能够分析出有些涉及用户隐私的信息。
大数据时代每天必然要产出海量的信息数据,从个人隐私至国家机密信息,包罗万象,保障这些高价值信息的安全也是一个很大的挑战。虽然说亡羊补牢为时未晚,但是重要信息一旦遭受攻击被窃取,在信息价值水涨船高的现代社会,一定会收到严重的创伤,那时就来不及了
大数据时代才刚刚来临,在信息技术持续飞速发展的现在,随着智能终端的增多,必定也会带来更多的信息安全风险。如何应对未来可能会发生的数据安全隐患自然也成了需要重点研究的问题。
大数据时代的到来是当今计算机技术,网络技术蓬勃发展的最好的证明,为所有现代人带来了福音,但是在享受的同时还要担忧可能会发生的数据安全隐患是很扫兴的事情。事先做好防护,主动使用加密软件对所有重要信息进行加密,做到有备无患,尽情享用大数据时代创造的数据财富!