孙立林在分享中,从更高的角度提到了什么是计算架构的本质,同时,也提出了对于计算架构的三大矛盾:个体隐私和中心监管的矛盾,交易隐私和登记确权的矛盾,以及数据的归属权到底是谁的矛盾。同时,对于一个业内颇为流行的观点,孙立林也提出了自己的不同见解:“区块链等于生产关系,AI等于生产力,我并不完全同意。”
孙立林简介: 孙立林,矩阵元创始人,历任中国银联战略发展部高级研究员、市场拓展部高级主管、中国银联旗下第三方支付公司常务副总经理。 孙立林先生拥有10余年银行及咨询从业和管理经验,先后担任Chinaledger创始成员及技术委员会副主任、工信部区块链论坛创始成员及理事单位公司、ITU数字货币工作组安全组副主席、中国证券基金业协会金融科技委员会委员、中国互联网金融协会区块链工作组成员、中国支付清算协会区块链工作组成员。
以下,为孙立林关于计算架构与区块链关系的详细分享,希望对你有所启发。
感谢CSDN蒋总和孟总邀请我过来。从二十年前看《程序员》,到今天有机会在这里跟大家交流,也是一个机缘,我想给大家介绍下一代计算架构,以及我对整件事情的理解。
我们所有的治理架构都是一个树状结构,这个树状结构在现实生活当中,尤其是在金融领域里所有的上一级核心节点,意味着报文转发,只有上一级节点才能做报文转发,所有的同一级节点不能直接做通讯,这是金融架构的基本原则。但这会导致数据的流动性不充沛,这会引发很多问题。如果是同一个树下还好,如果是跨域了,金融行业的数据树和医疗行业的数据树要协调的话,可能就要到国务院这个层面。
我们通常不提去中心,它其实是无中心。在这个点上,数据如果想做交换的话,就只能靠人为成立委员会机制来处理。
所以,为了极大处理数据的流动充沛性,需要引入新的处理结构来处理这个问题,这是我们对区块链的基本理解。
并不是所有的机构都适合用区块链。金融行业会优先于互联网,因为金融行业的人天生是算钱的,当数据的流动性变的格外充分的时候,交易如果变化,T1或者T0会带来巨大的交易,其他行业来才会逐渐感受到数据被当做资产来做定价后流动性加速带来的收益,但是这个事情仍然需要一段时间才能实现。
区块链等于下一代计算架构吗?我认为不等于。
计算架构的本质
计算架构本质上就是三件事情,我们所有的手机、电脑、PC、超算本质上都在处理三件事:计算、存储和通讯,区块链就是不断地在这个领域里发现问题,解决问题。
所以我个人对于很红的一句话:区块链等于生产关系,AI等于生产力,我并不完全同意。大家完全忽视了区块链带来的技术的巨大挑战,无论是工程上还是理论上其实有很多问题要解决,不是大家想的那么简单,只是生产关系或者是说的很悬。
技术上是有大量工作要做的。
这是我们的根本问题,什么叫多源异构,就是多数据源和不同的架构,在今天的治理架构下,银行卡的中心节点是银联,他们做的工作本身都是报文的转发。
有没有可能人类在不断互联互通的过程当中形成一套新的超级清算体制,完全无视于上层的应用?不管是金融医疗还是交通,也不管是票据债券银行卡还是其他服务,都可以通过一套超级清算体制把一套基本的报文转发体系做好?这件事情完全有可能。
割裂的互联网
今天我们所有的网络其实只是做了订单的转发和撮合,今天在线支付是假的,实际上订单最后的成交是要进专网完成。
2013年我第一次看到一篇论文时,觉得很震撼,所有做支付清算的人应该反思。它第一次提出了新的解决方案,没有新的技术,但是解决掉了可以真正做线上支付并且可以真的没有差错。
在今天真实的交易世界里,每天都有大量的差错发生,因此从对账开始解决问题,这也是割裂的互联网不能解决的问题。
我们提了一个想法,机器猫小叮当可以从他的肚兜里掏出任意门,所以我们用了这个词,未来可以把不同行业不同领域不同信息不同报文的格式通过这样的超级清算方提供解决方案,协同计算是区块链根本无法解决的。
关于算法架构的基本理念,关于为什么要用区块链,我也听到过很多人激烈反对区块链的理由,今天我们做的所有的金融交易本身都是代理人机制,无论你是用支付宝微信还是银行卡,无论是买股票还是买别的交易都是通过代理人完成的,因为最终交割双方无论他是咖啡店还是买卖的对手方,无论是中央对手方清算还是其他的清算,本质上他都无法相信这个付钱的人或者是提出交易请求的人,需要经由你背后的交易体系或者是银行或者是有资质的机构提供这样的支付服务。由你在这个机构的请求来传递这个支付,这就是本质上作为交易代理的基本属性,在这个属性下大家因为习惯了,你掏出银行卡或者扫码的时候没有计较商户是否信任你,本质上商户完全不信任你,他只是信任你背后的架构,在下一代所有的机构引入算法后,就是算法即信任,认证即交易,只要你完成了交易,理论上就可以完成所有的事物,所有的事物都可以在上面发生。
算法世界
这是我们注册的一个品牌,叫“算法世界”,在此给大家解释一下,CSDN还有其他的朋友提了通证的概念,我也相当认可这个概念,我想稍微解释一下,我们角度不一样的地方。
我们把它叫做流动性的基本度量衡,无论它是法币还是现在的通证或者叫Token,本质上是数据交换的度量衡,但是这个度量衡怎么出现的,我们总结了几个基本问题,全数字世界会有三大基本矛盾。我们认为所有的算法所有的计算架构都是基于这三大矛盾展开的。
第一是个体隐私和中心监管。按照央行提出的监管,法币叫前台自愿,后台强实名,在这样的架构下会出现一个问题,一旦流动性得到充沛的管理,意味着给每一个流动性每一个数字货币法定货币打上了一个标识,这个在传统的金融交易里也把它叫做“标记化”,一旦打上了所有的交易是无所遁形的,这个流动性被全程监控,因此个体的隐私在监管下是暴露的,这是个矛盾,是中性词并不是一个负面词,这个矛盾需要有很多的算法解决这个问题。这个矛盾你无法回避,因为我们生活在这个世界里必须遵循这样的监管规则。
第二个矛盾是隐形的共识。就是交易隐私和登记确权,其中第一个经常说的就是ID你的身份隐私,第二个就是交易隐私,交易包含三大要素,第一是交易的地址,无论你账户还是IP,第二是你的余额,第三是你的流水,这是交易的隐私。今天我们做的所有交易实际上在平台一级做的本质的事情都叫登记和确权,或者叫登记存托,只要你买了任何一笔股票,中债知道,银联知道,购物京东淘宝都知道了,这意味着你在交易平台的账户体系和交易的地址是完全裸奔的,完全被平台所知道的。
今天人类的解决方案是给这个交易平台发交易许可证,金融是发的,但是互联网公司是没有发的,这意味着我们的交易流水是完全裸奔的。今天不公平的地方在于所有的互联网工业本质上把我们奴役了,我们所有人都是互联网公司的奴役者,第一他没有征得你的确认,第二他赚了钱也没有给你分,这个不公平。处理这个矛盾的唯一方法是对这个交易做密文登记,当然你可以选择裸奔,理论上我们可以提供一种能力,让所有的交易变成密文在平台上出现,这是第二种矛盾,叫隐形的共识;
第三是数据。一旦你向平台提交了数据或者是开放的API,你的数据就被别人汇集走了,这个矛盾背后的原因来自数据主权,数据的归属权到底是谁,区块链无法解决这个矛盾,原生的区块链根本无法提供隐私保护,所有的加密、MPC是新的算法,不是原生的狭义的区块链。
这里我们提出数据孤岛的隐性桥梁,所以我们说区块链只是下一代架构的一部分,它很重要,但是只是一部分。
基于此,我们推出了区块链的开放服务平台,网站的名字叫JUICE,我们全面向开发者开放出来。
技术方面我不多介绍,区块链公司都大同小异,我们做了大量金融机构的工作,因为保密始终没有披露出来,但是想跟大家解释的是智能合约真的没有那么智能,不能解决所有的问题。智能合约过于复杂,而且对底层的虚拟机构的压力会非常大,因此我们在下一版核心架构里几乎全部重写了,纯粹摄取出来的代码几乎无法在商业领域使用,必须全部重写,这是我们实践的体会。
我们下一代计算架构叫JUGO,就是多源异构,多数据源和不同的架构,用在多方计算平台。这是我们MPC安全多方计算的架构,它的数据都在本地没有被对方归集走,但是大家可以看到解决,这是我们最想看到的数据化的未来,本质上把所有的合约重新打成了逻辑电路,实际通讯看到的都是逻辑电路,而看不到原生的合约。实现了两个价值,第一个是彻底的隐私计算,第二个是彻底的并行计算,目前为止我们发现只有这一种方法可以实现无视于上层应用把它拆成基本的函数,当然这里会动到很多底层的算法。
IBM前一段时间公布了同态加密速度提升了75倍,这个很不错但是一点用都没有,全同态要用在商业至少还得提高十万倍,这个需要很重的科研投入才可以解决。再就是硬件加速,我们认为这代技术架构带来的变化远超移动互联网,甚至比上一代的互联网还要伟大,因为它给技术复杂度、通信复杂度带来的挑战是前所未有的,计算复杂度就必须动到整个硬件架构的重构。
为什么最近AI芯片很火,因为CPU已经无法满足性能了,通用架构已经不够用了,GPU我们认为也不够用,所以现在FPGA非常火,我们认为这个可能是真正的分布式硬件计算的未来,这套东西的出现和前端的算法和整个计算架构的结合才有可能带来真正的变化。
解决方案我大概介绍一下,其他前面很多朋友都介绍过类似的,我们的思路略有不同,无论是存证、溯源、安全共享,我们所有的思路全部是运营商化。我们的思路是即便是金融机构整个技术架构体系,比起运营商来说仍然是落后的,我个人最看好的运营模型就是电信运营模式,全程全网的计费和超级运营商体系,我们希望在下一代的集成架构以区块链为代表的架构里能够实现这样的全程全网,全部打包成基本的服务作为网关来提供。
MPC是我们最有热情和投入最重的领域,数据无须归集和共享,完全支持自定义逻辑和共享,我们已经提供了整个编译器,提供了一个语言(Frutta,西班牙语的水果),在三方计算架构里2到3是一个巨大的变化,3方架构里只能做到定制,只能在局部场景定制。一旦做到通用架构,规划至少需要半年以上的时间,算法挑战很大,下一步的计划除了要支持硬件还会彻底支持上层的深度学习。
案例分享
这是我们做的一个实际案例——就是征信,为什么要做这个事情,所有的券商花了无数的获客和风控的成本,拿到的合格投资人黑名单白名单是不愿意共享出来的,这是他的核心资产,那怎么办,大家一起计算一个结果,所以我们把它叫做协同计算,计算完的结果可以在区块链上被加密、登记交易,这是大家经常提到的区块链做数据加密共识的结果,但是本身要把共识层和计算层剥离,把计算层剥离出来后交给电离层做计算,经过隐私处理的合约交给区块链做交易。
前一段时间地方政府提到了让数据多跑路企业少跑腿,很多人提到用区块链解决隐私保护,我个人的观点这是不大可能的,原生的区块链完全无法提供这样的隐私保护能力,在跨部门跨账户体系跨行业跨不同的学习算法之间来做隐私保护区块链目前做不到,只有新的算法来做,必须告诉大家的是,必须在前端对数据做大量的预处理,不然跑不出来。
接下来分享一个给基因行业做的实际案例,基因对隐私保护要求非常高,而且数据量非常大,一个人生能够产生的基因数据量是200GB,不考虑40岁以后每年产生的突变,基因会变异,但是基本上200GB这个数据量超级大,在数据协同操作下才能解决这个原生的问题,区块链无法解决这个问题。
这是航空航天的案例,去年虹桥机场发生了两架飞机差点相撞,一个是排序系统出了问题,再是中心化系统导致同一级节点之间无法通信成了数据孤岛,只有在完整的区块链架构下能够做到这样的共识和对账,确保所有的事物——就是飞机和地面所有的通信是完备一致的,不会出问题,如果这套系统真的上了,有大量的问题可以通过这套架构解决。
我们的口号叫“为了数据的流动”,我们希望大家能看到核心的问题是场景业务化,业务数据化,数据资产化和数字交换货币化,数据一定要流动起来,一定要对数据的流动做定价,区块链也好下一代计算架构也好,如果不能给数据的流动性定价作出贡献,那么它就没有意义。
孙立林:下一代计算架构