区块链和大数据都是热门的话题,很多人把他们放在一起讨论,希望能碰撞出更多的热点。大数据发展早于区块链,目前已经成为一个庞大的产业。而区块链处在产业的初期,很多技术和商业模式还在探索之中。
鉴于大数据产业相对比较成熟,我们以大数据为出发点,来看一下区块链技术如何与大数据产业的各个环节进行对接。
大数据核心产业链条可以大致分为以下三部分:
产品部分:包括大数据基础软件、大数据应用软件等大数据软件产品相关产业。
数据部分:包括数据源(数据采集、数据提供)、数据流通(数据交易、数据共享)等与数据直接相关的产业。
服务部分:包括大数据基础设施服务(数据存储、数据传输、数据清洗、数据脱敏等)、大数据分析服务以及大数据应用服务等服务类相关产业。
01产品部分
软件产品和区块链的结合,其结合点应该是在技术方面。大数据技术与区块链技术中有相似点:都是分布式架构。
然而他们又有很明显的不同点:大数据技术中使用分布式技术是为了计算资源——利用多台机器的计算资源,将单机无法处理完成的任务,分配给多台计算机完成,每台计算机通过处理不同的任务,整合多台计算资源,形成强大的数据处理能力。
而区块链使用分布式技术是为了让多个主体能够相互信任——每个主体通过自己控制的计算机参与到整个区块链的运行中,每台计算机运行的任务基本相同,整个区块链通过大量重复冗余的计算,实现多主体之间的相互信任。
从技术角度看,大数据技术用信任换取了计算资源,而区块链技术用计算资源换取了信任。由于两者之间的这种区别,在技术上,大数据和区块链很难找到合适的碰撞点。
02数据部分
在数据部分的多种业态中,区块链都能找到其用武之地。
数据源:如果数据是由单个主体所采集收集的,不涉及到信任问题,引入区块链的意义不大。但如果涉及到多个主体进行数据采集、提供数据的情况,区块链就可以发挥它的作用了。
为了解决多主体之间的信任问题,每个主体都将自己采集到的数据广播给所有使用方,并将数据的Hash值保存在区块链上。区块链上的每个主体都可以根据区块链上的Hash值,验证自己收到的完整数据是否被篡改。区块链的可追溯性和防抵赖性,让多方提供数据时更加可信。同时,这种方式也有助于维护大数据的完整性。
而在数据流通行业,区块链能起到的作用就更大了。在大数据流通行业中,大数据本身就是一种数字资产。数字资产的交易,可以通过区块链实现。并且,在区块链上实现的去中心化大数据交易,可以减少原始数据的接触者。在一个去中心化的交易平台上,只有买卖双方可以接触到原始数据;而在中心化的交易平台上,作为交易中心的数据中介通常也会接触到原始数据,这就增加了数据泄露、资产损失的风险。
03服务部分
在大数据服务中,服务能力作为一种数字资产,与数据交易中的数据即为资产的理念是一样的,都可以进行交易。
而区块链在这种数字资产的交易中,就能够发挥重要的作用。同时,近期又有很多新的技术在不断改变着区块链,例如同态加密技术。同态加密是区块链与大数据服务结合的一个重要技术点,同态加密能够真正实现将数据的服务能力转化为数字资产,同时又不会有服务中原始数据被大数据服务商拷贝的风险。
综上所述,区块链与大数据还是有很多碰撞点的。本文只是分析了用区块链技术去碰大数据产业的情况,而用大数据技术碰区块链产业,也同样有大量的热点,我们在今后的文章中会讨论到这个问题。