刘睿民:区块链能否助力大数据安全应用?

区块链作为一种分布式数据管理技术,受到了越来越多的关注。从金融业到政府部门、医疗业、零售业乃至新兴制造业,区块链几乎成了能够创造更多价值的神器。

大数据安全在已上升成国家安全极成部分。最近我正在方面做探索,比如与金融界合作,尝试将分布式数据与区块链术结合在一起,意味着可以即时发现数据中的数据出状况,从而真正保障数据安全。


块链应用平台的风险防范


从技背景看,区块链基于分布式网才得以生,在金融域,区块链就是分布式本。分布式总账的特点,将致金融交易由净额交收成逐笔交收,它可以24小全天候运使得金融服可以离开行的物理网点直接入到生活景。同也从根本上覆改了金融机构的组织结构和业务结构。因此,华尔街的一些金融机构已公开宣称自己其是一家科技公司。


块链一种分布式数据管理技,受到了越来越多的关注。从金融到政府部、医疗业、零售乃至新制造,区块链几乎成了能够创造更多价的神器。但最近基于区块链全球最大众筹目The Dao被黑客攻致价6000万美元的360多万以太被劫持,引起内震和高度关注。恰恰是事件,除了反映出区块链整体依然测试阶段,去中心化的智能合根本无法避免技上的操作风险,和主上的道德风险等方面问题之外,个事件最重要的启示在于:块链术应用平台存在的风险,需建立一套密追踪规则,以确保大数据用安全。


块链术应用平台的风险到底如何防范? The Dao被攻事件反映出基于区块链术应用平台的技术风险可能将期存在。由于区块链所具有的不可改和不可逆性,一旦遭到黑客攻,无是硬分叉分叉的解决方案,其成本都相当高昂。因此,区块链在金融等景的用上,更需要高度关注潜在的风险,而我们拥有的分布式内存数据,恰恰可以让这样的技公司帮助制定相控措施和案。


在数字货币展中如何突破区块链的技障碍?区块链是国家行的加密数字货币的基础设施,也是其行、流通和算的技术实施渠道。因此必建立严谨划和设计,尽量找到能使区块链现有特征得到充分体并且能突破区块链发展障碍的运用案例。而减少“试错成本”,是区块链和国家行数字货币的重要条件。在方面,我的分布式内存数据恰逢其,能在数据安全保障方面做出献。


分布式构所具的技经济可行性表明,区块链术发展至今已可以通构建分布式构体系和参与者共事协议,形成不需要中心的、大模的数据,所有定的参与者都参与数据的记录验证,再通分布式各个点。即使部分点受到攻害,也不会影响整个数据的完整性和信息更新,但任意点的更都会被各个点记录


分布式算集群的作用


从区块链术应用的可行性可以看出,分布式的概念更加切准确。中国大型金融机构目前已建成超高速、大流量、中心化的信息技,在区块链术应用中,各金融机构共同建分布式的,充分利用有技,可确保交易速度,实现控制的目的。


数据可能会泄露,也可能会透某种方式渗透入网,可以通排序、机器学,通人工干的半督学、深度学,拼凑出某种完整景,以探索出并固定住某种经验。人类过去从没做到一点。机器累知能力,将大提升人使用知的能力。


中国大做分布式数据的人很少,而做内存式数据的几乎根本就没有。上世90年代中期以后,中国大数据一直美、德等国外厂商所断。当中国本土众多件公司所追求的,可能更多的是短期效益,而不愿数据库这样的慢。再加上数据本身技术标苛,算法定性要求很高,实现难大,是一种慢工出活的域,中国公司如果起步晚,累少,在当肯定就会得落后,所以种支撑大数据核心展的基真的需要国家的大力支持。


两年前我即开始启流数据研究,那国内没有人提这项研究。因为时势都未到,但它所生的必要条件均已具。所以当我做出个数据后,今后将要充分发挥这些必要条件。中美家包括中国工信部家都流数据在中国国内出感到惊。我柏睿数据撰写的数据库标准已被国信息准化委会通,成际认定的中国国家级标准,受到国内外同行的充分肯定。同,国家也在根据一国际标准制定国家准,我国家在国大数据域已经拥有自己的,美德日一统标准的代已底成去式。


下一代件开术趋势可能会有很大化。并行算今后可能会要求很高,也是我正在做的事情之一。但有些概念,国内存在混淆象。比如我一直MPP内存数据,有的人却说这是分布式数据。其MPP也是一种分布式,而原上,MPP是海量并行理,算是一种分布式,但分布式并不得是MPP。所并行理是每个元与其它元有关。最近两年,并行算确了一些言或件开方法,趋势。尤其是当理的数据量很多,则对之后的影响会很大。方面,国内累真的不多。


3年前,我曾认为,理想中一个分布式的MPP海量并行的内存数据就已足,我能理的数据,比如是64G内存有100个点6个T的数据,就得很大了。但去年很多用已开始我,你能不能理256G内存的单节点数据。展真是太快了。


下一个趋势是,单节点可能至少要理4个T的数据,4个T1000个点就是4000T。在做好算法,系统稳定的条件下,4个T数据可在数分之内理完是一个比漂亮的果。就硬件而言,CPU自身速度在提高。而分布式算集群在越来越大。在之前是很难预料的。


的内存数据内部测试现在已达到256个点,下一步可能是512个点,是数据一个比大的趋势。3年前我开始考的流数据,去年一想法已开始成熟,原以可能要等候两三年才能出成果。在看,如果每个人手中的手机云端数据直接入我的有数百台机器成的内存池子,入流数据,做一些简单查询,或入分布数据做非常复的分布查询程都无需落地,只在内存里跑。是一个比完整的体系。之后,是深度学的算法,也存于内存之中,而且要与数据库紧合。也就是,在只要有数据的地方,就有算法围绕着它。今后朝着个方向才是大数据展的必然趋势


块链大数据安全用关涉国家


从区块链所具有的分布式功能也可以看出,通构建分布式数据和参与者共识协议,能数据的完整性。而区块链时间戳功能,可以通生成一定时间段的信息区以及区的首尾相数据,形成不可造的数据。当每个参与者入区块时加盖时间戳,就能够证明原性和所有权归属,必然有利于保信息的私密性。因论谁动过你的奶酪,都会留下痕迹,你奶酪的人必然会待。


然区块链术应用目前还处实验段,但人迫不及待地希望区块链提供某种安全保,以便将复经济生活简单易行。比如便捷支付,比如在医保健等各种社会服务领用区块链,可以提高效率,节约成本。尽管区块链术应用的潜在风险开始暴露,但与此同块链术应风险的管控也越来越受到重


从移网到大数据、区块链,当今代,技术变化的潮流不可,以至于很多人一以明白和适。但毫无疑,区块链正在大数据汹涌而来。区块链的可信任性、安全性和不可改性,正在更多数据被放出来。


看到,数据的“看、复制即被有”等特征,曾经严重阻碍数据流通。但基于去中心化的区块链,却能破除数据被任意复制的威,从而保障数据有者的合法益。区块链还提供了可追溯路径,能有效破解数据确权难题。有了区块链提供安全保障,大数据将更加活


大数据代的来众多企业带来了全新的机遇和挑。随着数据量、数据种的增多,企史数据分析渐渐过渡到基于多源、海量数据的实时分析。我都知道商战场能在企中做出快速、高效的分析决策,就能日益激烈的市场竞争中立于不之地。RDP通提供从海量数据存、分布式内存算、分布式内存数据、内存数据分析挖掘以及数据可化的整套支持,解决了企在大数据和快数据存、分析、挖掘域碰到的各种问题。作业级解决方案,可管理性是RDP的优势,用友好的管理界面提供了系安装、系及集群配置、控及警等多方面的一站式支持。RDP架构具有高可用性和快速故障恢复能力,HDFS2作其底数据持久化存的支撑技了数据的持久化和冗余复制,并具有数据自动检测和修复的容功能;大、高效的内存数据复制、持久化功能,保内存数据安全可靠。在安全域,与Kerberos/LDAP行整合,支持粒度访问控制、用程序安全及数据加密及解密等等。


当今从事大数据用者很多,也有很多从事大数据交易的企,如果能形成合力,整个大数据生良性循,将是一件令人乐观的前景,也将会中国大数据经验和人才。因此,政府需要在方面极加以引。大数据用不只是一种潮,因潮散去,会留下什么呢?如果形成生,在数据和数据理方面,包括中件方面,也可能存在基础软代升问题要解决,以有技术发趋势,而很可能使中国出一些大的基础软件公司,与甲骨文公司、SAP公司等国头竞争。大家拭目以待!


(作者中国人民大学大数据统计实验室主任、柏睿数据科技有限公司董事