“大数据将从一个时髦的概念走进我们生活中的方方面面。帮助我们更好地认识世界,认识自己,构建全新的社会关系。”清华大学数据科学研究院执行副院长韩亦舜说。
“《关于促进大数据发展的行动纲要》(以下简称《行动纲要》)标志着大数据在我国的发展与应用已经上升到国家战略层面。”赛迪顾问分析师卢敏说,“《行动纲要》明确指出推动政府大数据开放、共享和安全的重要性。而要使《行动纲要》中的内容尽快成为促进大数据发展和推进大数据应用的实际行动,还有很多问题要解决。”
数据潜在利用价值高
《行动纲要》涉及三个关键词:共享、开放、安全。卢敏指出,三个关键词背后指向三个问题:“共享”指向为什么要加快政府大数据公开的进程,“开放”指向企业创新的动力源在哪里,“安全”指向如何保护个人隐私和信息安全。
“政府大数据公开的目的是改善民生,企业创新的目的是促进结构转型,信息安全建设的目的是完善法律。三个关键词分别指向社会、经济、法律等不同领域。由此看来,大数据产业牵一发而动全身。”卢敏说。
共享、开放、安全的出发点和落脚点都指向政府大数据的开放共享、研究与应用、示范影响效应等。我们不禁要问,政府大数据的价值究竟何在?
就数量而言,BAT(百度、阿里、腾讯)拥有数以亿计的用户量,但这与政府大数据规模相比,可谓小巫见大巫。卢敏介绍说:“粗略估算,全国政府大数据加起来至少也有数百甚至上千个阿里巴巴的体量。”
至于政府大数据的质量,则可以通过和BAT企业对比来说明。据介绍,百度拥有庞大的用户搜索记录,每个网民都会留下众多记录,但这些数据较为单一,不进行关联应用就无法显示价值;腾讯的优势在于拥有数以亿计的QQ和微信用户量以及更庞大的社交数据,但这些数据目前仅局限于营销应用;阿里的交易数据似乎价值更高,但也只是局限在电商领域以及外延应用。“BAT的共同短板在于数据种类的单一化程度较高。”卢敏说。
政府大数据涉及工商、税务、司法、交通、医疗、教育、通信等等领域,数据的种类繁多,关联性强、统计规格较为统一,便于应用处理。九次方大数据创始人王叁寿曾表示“政府的数据事关百姓生活的方方面面,数据的利用价值也最高”。
开放标准待建立
真正的大数据除了量大,另一个特点是变化多,如图片、视频、大段文字这些不能用数字化处理的数据,属于非结构化数据。只有非结构化的数据才更具有开发价值。
政府的很多数据,例如人口、户籍等,属于结构化数据,离非结构化的大数据概念还有一定距离。但就目前阶段来看,政府推动大数据产业发展仍有现实意义。
通过与大数据紧密相连的互联网,在市民服务设施众包、提高政府监督职能等方面,百姓能够参与进来。“政府信息的开放共享,有助于提高政府的公信力。”韩亦舜说。
政府数据的开放,不但能帮助政府提高自身透明度并提升治理能力和效率,也是促进经济发展和社会创新的重要推力。然而,在政府数据资源共享开放工程当中,数据的开放程度与开放内容的标准,目前似乎并没有定论。
复旦大学国际关系与公共事务学院副教授郑磊在《中国开放政府数据平台研究:框架、现状与建议》一文中提出,经过样本的数据采集分析,截至2015年5月,各地开放政府数据实践共计公开了1963个数据集。其中公开数据最多的是武汉(635个),最少的则是贵州(17个)。
努力打造大数据产业新高地的贵州,在政府数据开放方面面临着新的挑战。
郑磊指出,中国开放政府数据实践存在的问题主要有目前开放的数据量少、价值低、可机读比例低,开放的多为静态数据,数据授权协议条款含糊,缺乏便捷的数据获取渠道,缺乏高质量的数据应用,缺乏便捷、及时、有效、公开的互动交流等。
“《行动纲要》为信息开放共享指明了出路,但是政府大数据如何应用,还要看接下来的行动和规则制定。”卢敏说。
针对问题,郑磊建议加强管理架构建设,制定相关政策与工作机会,提高领导支持能力,基于社会需求开放高价值数据、展现数据应用,提升数据开放性与可机读比例,规范数据更新周期,落实数据更新工作,完善数据授权协议,降低数据获取与互动门槛,推动有效公开的沟通。
数据利用如何破冰
目前,一些发达国家政府在数据开放方面走在了前面,甚至把数据开放当做执政自信的标志,公开一些政府日常消费方面的支出供市民监督。
我国政府数据利用方面特别是数据共享方面确实存在一些误区。一方面说到开放就好像完全没有隐私,另一方面安全问题又成为了数据开放的最大障碍。
韩亦舜认为,政府数据开放要在实践中摸索前进。先把政府部门内部及部门之间数据共享的工作做起来。对社会的数据开放共享,先从方便百姓生活又不是很敏感的数据开始。特别是涉及公共安全、公共利益的数据,提供公共服务的机构或企业有义务在一定前提条件下开放,“这样一些可以预警、预防的群体性事件就能够避免”。
韩亦舜指出,按照流行的大数据的几个“V”(大量、高速、多样、价值)或者多源异构的定义来衡量,政府的部分数据,还属于结构化数据,离大数据概念还有差异。但没有必要拘泥于大数据的定义,只要政府充分运用数据的挖掘利用,提高政府治理能力,提高科学决策能力,受益的将是全社会。
在政府开放数据方面,韩亦舜建议,各级政府都以数据应用为导向,需要什么数据就共享什么数据。虽然,与大数据的开发共享还有距离,但确实是数据应用的可行路径。
韩亦舜说,相信越多的人从数据开放中获益,就会有更多的人愿意开放数据。
背景资料
《关于促进大数据发展的行动纲要》
主要内容及对产业的部署
《行动纲要》的内容可以概括为“三位一体”,即围绕全面推动我国大数据发展和应用,加快建设数据强国这一总体目标,确定三大重点任务:一是加快政府数据开放共享,推动资源整合,提升治理能力;二是推动产业创新发展,培育新业态,助力经济转型;三是健全大数据安全保障体系,强化安全支撑,提高管理水平,促进健康发展。围绕这“三位一体”,具体明确了五大目标、七项措施、十大工程。并且据此细化分解出76项具体任务,确定了每项任务的具体责任部门和进度安排,确保《行动纲要》的落地和实施。
五个目标:一是打造精准治理、多方协作的社会治理新模式;二是建立运行平稳、安全高效的经济运行新机制;三是构建以人为本、惠及全民的民生服务新体系;四是开启大众创业、万众创新的创新驱动新格局;五是培育高端智能、新兴繁荣的产业发展新生态。
七项措施:完善组织实施机制、加快法规制度建设、健全市场发展机制、建立标准规范体系、加大财政金融支持、加快专业人才培养、促进国际交流合作。
十项工程:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。
按照国务院的部署,工业和信息化部主要负责推动大数据产业发展,培育新兴业态,助力经济转型,包括推进大数据核心技术攻关、健全产品体系、完善产业链和发展环境、推进工业及新兴产业大数据应用,同时做好信息安全和规范管理等的相关工作。重点组织实施十大工程中的“大数据关键技术及产品研发与产业化工程”“大数据产业支撑能力提升工程”“工业和新兴产业大数据工程”三项工程。