《孙子兵法》说:“多算胜,少算不胜。”今天,决定能否“多算”的重要因素在于,掌握数据的多少以及对数据处理能力的高低。有了大数据对象、大数据处理与应用的技术,再与各类实际应用需求相结合,大数据将给经济社会发展带来巨大影响。
安晖(工业和信息化部赛迪智库软件与信息服务业研究所所长)
肯尼思·丘基尔(《经济学家》杂志数据编辑)
吴辅世(美国商业分析软件与服务供应商SAS公司大中华区总裁)
尼丽·克洛斯(欧盟委员会负责数字议程的委员)
维克托·迈尔·舍恩伯格(《大数据时代》作者)
陈建利(新加坡国立大学教授)
迈克·弗劳尔斯(纽约市打击金融犯罪行动组主管)
惟有坚持“对象、技术、应用”三位一体同步发展,才能充分实现大数据的价值
安晖:当前,全球的数据总量正呈指数增长,过去3年间产生的数据量超过以往总和。移动互联网、物联网等的迅速发展,使新数据源不断出现,GPS、传感器等数据持续、大量产生。而数据获取成本、存储成本和处理成本的下降,也推动了数据量的膨胀。
美国麦肯锡全球研究院2011年6月发布题为《大数据:下一个创新、竞争和生产力的前沿》的研究报告,指出“大数据时代已经到来”,数据正成为与物质资产和人力资本相提并论的重要生产要素,大数据的使用将成为未来提高竞争力的关键要素。美国政府于2012年3月宣布“大数据的研究和发展计划”,以提高对大数据的收集与分析能力,增强国家竞争力。
其实,不仅是美国,其他一些国家也都把大数据提升到国家战略层面,认为未来国家层面的竞争力将部分体现为一国拥有数据的规模及运用数据的能力。有学者把大数据形象地比喻为推动人类社会发展的“新石油”。
信息技术领域原先已经有“海量数据”、“大规模数据”等概念,但这些概念只着眼于数据规模本身,未能充分反映数据爆发背景下的数据处理与应用需求,而“大数据”这一新概念不仅指规模庞大的数据对象,也包含对这些数据对象的处理和应用活动,是数据对象、技术与应用三者的统一。
大数据对象既可能是实际的、有限的数据集合,如某个政府部门或企业掌握的数据库,也可能是虚拟的、无限的数据集合,如微博、微信、社交网络上的全部信息。
大数据技术是从各种各样类型的大数据中,快速获得有价值信息的技术,包括数据采集、存储、管理、分析挖掘、可视化等技术及其集成。
大数据应用是对特定的大数据集合,集成应用大数据技术,获得有价值信息的行为。对于不同领域、不同企业的不同业务,甚至同一领域不同企业的相同业务来说,由于其业务需求、数据集合和分析挖掘目标存在差异,所运用的大数据技术和大数据信息系统也可能有着相当大的不同。惟有坚持“对象、技术、应用”三位一体同步发展,才能充分实现大数据的价值。
大数据是信息技术与专业技术、信息技术产业与各行业领域紧密融合的典型领域,有着旺盛的应用需求、广阔的应用前景。为把握这一新兴领域带来的新机遇,需要不断跟踪研究大数据,不断提升对大数据的认知和理解,坚持技术创新与应用创新的协同共进,加快经济社会各领域的大数据开发与利用,推动国家、行业、企业对于数据的应用需求和应用水平进入新的阶段。
肯尼思·丘基尔:大数据一般是指一整套新的技术,分析社会中存在的比以往多得多的信息,通过这些新的分析工具,我们能从大量信息中发现一些有价值的东西。一些技术,如非线性或网络映射、机器学习等都是大数据分析的一个侧面。不管是在生物科学研究,还是在确定一个城市可能发生火灾的位置等公共政策问题上,大数据都在给世界带来变革,因为人类有史以来第一次可以真正地收集海量的信息。
吴辅世:“大数据”只是一个相对的概念。大数据可以是多种类海量数据,它挑战传统分析技术,正推动分析技术行业革新。这种革新始于企业需要处理这些数量庞大又变化迅速的数据,而旧的分析技术已无法满足需求。新数据分析技术和旧技术的不同之处在于:一方面,数据膨胀要求数据挖掘和统计分析技术性能的飞跃。另一方面,不同规模的企业如今都面临大数据时代带来的挑战,分析技术必须朝着平民化、易操作化方向发展:简单易懂、容易操作并且能为各类企业所用。SAS可视化分析解决方案就是一个很好的例子,即使使用者毫无数据分析专业背景,也能通过直观的图形界面轻松地进行数据分析。
大数据可以让我们更好地了解自己所生存的社会,并帮助我们做出更加明智的选择
尼丽·克洛斯:世界上每分钟产生1700TB 的数据,但是吸引我们的不仅仅是这个庞大的数字本身,还在于我们可以用这些数据做些什么。大数据是欧洲经济的“燃料”,如果这些数据可以在网上交互使用,它们将被用作改造社会、创造机遇和使服务更加透明高效和个性化的重要工具。
无论是工业、金融、研究、办公、媒体还是日常生活,产生的数据均可成为大数据的一部分。欧盟支持大数据建设的第一步是进行监管。欧委会于2012 年1月提交的“通用数据保护条例”等规定,旨在以较低的费用和简捷的重复使用条件,更加便捷地使用和重新使用公共数据。
大数据是一项革命,也会创造大量如“数据科学家”之类的新职业和新的就业机会。一些欧洲公司已经开始使用网上数据,并且在医疗保健、环境保护和科学实验领域取得了巨大的成功。
目前亟须对互联网上数据进行分析的人才,尽管很多新人已经开始关注这一领域,但就业市场上更需要的是有经验、有知识储备的人才。
维克托·迈尔·舍恩伯格:真正由大数据所构建的信息社会能够为每个人提供服务,让我们更好地了解自己所生存的社会,帮助我们更好地做出选择。
今天在日常生活中,人们的各种行为更多是依据感性的经验、感觉和所习得的知识,而不是以数据为基础的理性的实证分析。在未来的5到10年时间里,如果医生给病患使用的治疗手段不是建立在大数据分析的基础上,我们就理应会感到愤怒。
我们也会期待学校和老师能够在对教学案例进行大数据分析的基础上改进他们的教学方法并合理安排教学内容。同样,公司和企业会利用对客户进行大数据分析来创造新产品和新服务。当然,政府也会在大数据分析的基础上改进政策。所以,未来社会不仅意味着人们将拥有更加先进的科技设施和更方便的工具,同时也意味着更加信息化。
要实现上述目标,需要我们收集大量的数据并做出行之有效的分析,到那个时候,人人都会意识到数据的价值。
陈建利:机构和组织通过分析大数据可以挖掘有价值的信息。如银行可以通过分析客户数据以确定哪些潜在的信用卡用户可能无法还款;交管部门通过整合交通状况、天气以及驾驶员的地点信息等数据,可以更好地管理交通;大数据可能还会影响到人们的行为。如果驾驶员通过大数据了解到接下来15分钟原本要走的一些路段预测将出现交通拥堵,那么他就可能会决定绕道而行。
吴辅世:随着大数据时代变革的深入,企业开始逐渐认识到数据的重要性,并开始真正重视如何有效利用这些数据来产生更大的智慧和价值。大多数企业都开始意识到“数据”将成为其核心资产,希望通过收集和分析大数据来获取竞争优势。鉴于丰富的数据已经变成企业新的资产,很显然它所带来的社会效益和经济效益也将是无穷无尽的。大数据还将有利于解决一系列社会公共问题,包括医疗保健、失业、教育和经济增长等等。举例来说,根据经济与商业研究中心的最新研究,大数据将为英国经济增加2160亿英镑(约合3467亿美元)以上的潜在收益,这些收益来自于效率的提升和创新。
迈克·弗劳尔斯:大数据在市政管理中应用的好处是有助于优化行政资源的使用,使公共支出产生最大的效益。大数据在纽约市的执法、经济规划、防灾和灾后恢复等方面都有应用。比如大数据可以帮助预防犯罪,大数据的应用可让执法人员“先发制人”,在犯罪行为造成损害之前就能侦查到。
安晖:大数据对人类经济社会发展影响巨大,归纳起来主要有三个方面:一是能够推动实现巨大经济效益。据麦肯锡全球研究院测算,大数据将给美国医疗服务业带来3000亿美元的价值,使美国零售业净利润增长达到60%,使制造业产品开发、组装成本下降50%。而大数据所带来的新的信息技术应用需求,将推动整个信息技术产业的创新发展,预计2013年全球大数据直接和间接拉动信息技术支出将达1200亿美元。
二是能够推动增强社会管理水平。大数据在政府和公共服务领域的应用,可有效推动政务工作开展,提高政府部门的决策水平、服务效率和社会管理水平,产生巨大社会价值。欧洲多个城市通过分析实时采集的交通流量数据,指导驾车出行者选择最佳路径,从而改善城市交通状况。
三是能够推动提高安全保障能力。大数据在国防、反恐、安全等领域的应用,将对各部门搜集到的各类信息进行自动分类、整理、分析,有效解决情报、监视和侦察系统不足等问题,提高国家安全保障能力。总而言之,大数据将为人们认识世界和改造世界提供新的强有力工具,使人们能更加容易地把握事物规律,更准确地预测未来。
如果没有高性能的分析工具,大数据的价值就得不到释放
陈建利:只有当我们能够提出正确的问题,数据才是有用的。所以,更多的相关数据将会帮助我们,但也可以肯定的是,如果对数据没有良好的分析、处理,那么大数据也没有帮助。
吴辅世:如果没有高性能的分析工具,大数据的价值就得不到释放。如果不能及时有效处理,大数据的堆积和极速变化带来的后果将是我们无法掌控的, 它可能会为人类的生存、生活埋下隐患。不过,我相信2013 年是大数据蓬勃发展的一年,2013 年也应该是大数据真正进入大分析的一年。
除了大分析的新技术,企业还需要新人才。大数据时代对分析人才例如数据科学家的需求将激增,尽早开始人才储备也是企业稳步发展的优势之一。
肯尼思·丘基尔:大数据建立在统计学基础上。在大数据时代,统计分析更加重要,但它与统计方法又有许多不同。
在传统统计学中,我们所做的是试图通过最小量的样本观测来发现规律。由于数据的采集、储存和分析的成本高,因此人们只能采用抽样的方法。而在大数据时代,我们收集所有的数据,至少是与我们所研究的现象相关的所有可获得的数据,这是传统抽样方法做不到的。
另一个不同是, 在统计学中我们进行分析时,考虑的是与研究对象具有内在关系的因素。例如,分析一个借款者的信用状况,我们可能考虑若干个指标,据此判断他是否会按时还款。
大数据时代, 我们需要把一些具有非内在关系的信息考虑进来,比如借款人的头发颜色、其所使用的网络浏览器、打字时是全部用大写还是小写字母或者按照正常的拼写格式。美国一家金融分析机构就用到这方面的信息来预测顾客是否会按时还款。也就是说, 我们用到了外在的信息,但这些是具有相关性的信息。
在充分认识到大数据带来机遇的同时,也应该认识到大数据带来的可能性风险
肯尼思·丘基尔:大数据时代令隐私保护问题更加突出。大数据的价值在于存储后的再使用。不过,关键的一个问题是,收集、保存一切信息,与隐私保护政策是有冲突的。保存一切信息是必要的,但是在这么做之前,我们有必要问自己一个问题,即现行的隐私保护政策是不是妨碍了我们正在迈入的大数据世界。社会有必要就此进行大辩论,以便为大数据时代的隐私保护划定新的边界。
维克托·迈尔·舍恩伯格:大数据时代必然会导致人们更多的个人信息被搜集和捕捉,这势必会使很多人感到不舒服甚至不安。但是,对数据感觉到恐慌或者害怕只是一种“小数据时代”应有的情绪。在大数据时代,每个人身上能够被获取的数据点不再是百十个而是高达百万甚至上亿个,谁都根本不可能把某一个人身上的所有数据点全部掌握。所以在保护个人隐私的时候我们可能需要换一种思考方式。比如,我们的关注重点不应该是要不要提供出这些数据,而是如何使用这些数据。
实际上,大数据时代带来的挑战是如何利用大数据分析预测未来,而不是审视过去。比如,一些机构可能在数据分析的基础上做出预期评估,来拒绝一个人申请的抵押贷款,或者否决病患继续进行治疗的必要。在大数据分析的基础上,人们的个人意志和被公平对待的要求很可能被否定,这才是应该担心的地方。
对大数据进行集中管理会使其变得更容易查找,而且便于混合提取不同类别的数据。但是集中管理可能会造成严重的问题:一是可能沦为恐怖分子的袭击目标,二是会赋予管理机构过于集中的信息掌控权。
在我看来,在互联网全球化的时代,我们完全可以从不同的数据库中采集信息而不是一定要把它们集中在一起。
事实上,目前的世界大数据储存已经呈分散化的趋势,数据市场将会允许不同地域和不同条件下数据的储存,人们完全可以从各地的大数据库中提取不同的数据再进行协同整合。
吴辅世:任何事情都有其两面性。在充分认识大数据带来的机遇和利益的同时,我们也应该认识到大数据带来的可能性风险。大数据的数据量巨大、非结构性强、来源庞杂,当它超出我们控制范围时,不可预测的问题就将发生,这就对海量数据的分析及应用要求日益增强,对未来的预测能力和优化性前瞻洞察需求更高。
安晖:对大数据应用必须保持清醒认识,既不能迷信其分析结果,也不能因为其不完全准确而否定其重要作用。
一方面,由于各种原因,所分析处理的数据对象中不可避免地会包括各种错误数据、无用数据,加之作为大数据技术核心的数据分析、人工智能等技术尚未完全成熟,所以对计算机完成的大数据分析处理的结果,无法要求其完全准确。例如,谷歌通过分析亿万用户搜索内容能够比专业机构更快地预测流感暴发,但由于微博上无用信息的干扰,这种预测也曾多次出现不准确的情况。
另一方面,必须清楚定位的是,大数据作用与价值的重点在于能够引导和启发大数据应用者的创新思维,辅助决策。简单而言,若是处理一个问题,通常人能够想到一种方法,而大数据能够提供十种参考方法,哪怕其中只有三种可行,也将解决问题的思路拓展了三倍。
所以,客观认识和发挥大数据的作用,不夸大、不缩小,是准确认知和应用大数据的前提。(驻比利时记者张杰、驻泰国记者王慧、驻美国记者吴成良采访整理)