“对中国来讲,大数据是机会也是挑战。中国人口总量位居世界首位,但数据量仅为日本的60%和北美的7%,其中一半数据未获保护。在大数据技术方面,中国与世界先进国家差距巨大,还缺乏相应的法律和人才等。”中国工程院院士、中国互联网协会理事长邬贺铨26日在接受科技日报记者专访时说。
邬贺铨说,当前全世界数据量快速增长,新产生数据量年增长率达40%。如果把2011年获得的全世界数据量装到iPod上的话,可装满575亿个iPod。把这些iPod当砖用,可垒起两座中国长城。
百分点董事长苏萌强调,目前在全球,数据交换是一个问题。“最大问题是大家认为数据是资产和商品,但定价很难,国际上也没有很好的数据定价模型。目前做法是尽量让数据流动起来,在一些企业间或一对一企业间的一定量数据交换。”
“比如一家是做化妆品网的,一家是做服装网的,两家企业老总比较熟悉,两家网站的消费群体类似,都以女性为主,彼此可以进行客户数据交换。”华院数据董事长宣晓华说,如果直接做数据交换,消费者会顾虑隐私问题,可能比较容易接受的是,“用我的数据来改善企业对我的服务”。
“还要分清数据所有权问题,我今天上淘宝网购物,淘宝有我个人数据,我的行为数据是淘宝还是属于我?目前国际法律认为这个数据属于消费者,淘宝可以用,可提交用户体验,但如果淘宝把该数据卖给第三方就不行。”苏萌说,但淘宝对用户的理解和预测不是原始数据,是其分析结果。把这些数据与第三方分享在美国目前大部分市场上是认可的,如IBM等企业也在利用这些数据为第三方提供服务。
“在美国,一些公司把数据进行整合、加工,并提供服务,不过提供的是大趋势,把‘底层’的一些详细个体数据去除掉,这样能规避掉一些隐私和安全问题。”清华大学苏州研究院大数据中心副主任赵勇说,从大数据监管来说,肯定需要一个具有公信力的机构做监管,“最适合的是政府”。上海已成立大数据局,这是对数据管理的专业政府机构。最核心的管理是“数据拥有者是谁”“使用者是谁”“使用权限如何定义”“如何分级别”“谁是使用数据的受益者”等。
“美国将大数据分析作为国家战略来推动,政府带头进行数据开放。中国很多部门拥有的数据互不沟通,很难共享,导致信息不完整或重复收集等。因此,中国需要有国家层面的大数据战略、开放数据的措施及法规等。”邬贺铨说。