计算技术的诞生,预示了大数据时代的到来。从大型计算单元到微型处理器,从巨型计算机到微型服务器、PC以及今天不断涌现的移动终端,计算平台和设备的覆盖范围不断扩展,为海量数据的采集与处理不断提供着可能。
微处理器的演进不仅推动着计算平台的革新,也促进着智能设备向人们生活各个领域的渗透,从VCR、空调系统、汽车刹车系统到智能电视、家庭影院系统,再到可节约用水、大幅缩短洗衣时间的环保型洗衣机,当这些设备与互联网相连时,各种设备产生的数据将有机会汇入同一个数据海洋,这才是大数据能让人感到兴奋的地方。但如何从数据海洋中找到应用所需的关键数据又成了一个新的问题。
今天,亚马逊、阿里巴巴、腾讯等公司收集了数以百万计的交易和网页点击数据。对互联网公司而言,用以判断用户在线浏览和购买倾向的数据却可能因为数据规模变大而更难挖掘。
毫无疑问,可连接的物件将为人们的生活带来全新的体验。在物联网的情境中,数据来自传感器、控制器以及其他嵌入式智能器件。对于消费者而言,物联网的核心是个人应用。以时下流行的“量化自我”为例,它是一场将技术融入个人日常生活,以便完成数据采集的运动。数据采集涉及摄入(如食物摄取、周围空气质量)、状态(如情绪、兴奋、血液氧气含量)和行为(包括心理及生理)等方面。对“自我的监控”和“自我的感知”都可以变成可量化的数据,通过穿戴式传感器、穿戴式计算技术进行采集与分析。但每个人身上哪些数据是有价值的,可以为何种个人应用服务,又该如何科学、安全地采集并加以利用,在没回答这些问题之前,就盲目让个人信息汇入大数据之海,并通过互联网进行分享,风险可想而知。
在公共服务方面,国外已出现了借助“停车位置传感器”这样的嵌入式智能器件帮人们寻找停车位的实例。SF Park和 Streetline可收集并分发街道及停车场中停车位的相关实时信息,这不仅免去了司机兜圈寻找停车位的麻烦,还减少了交通拥堵现象。它还能帮助停车场的运营商,根据各区域停车位的需求状况相应减少或增加停车计时器的数量,调整停车场的泊车价格。虽然计算技术的演进和互联网的发展,已经让人们感受到了物联网的美好,但在各种数据汇入大数据之海时,其标准与格式的统一依旧存在很多问题,数据交换也未必安全。大数据之海很可能因此湮没数据价值。