群雄并起,隐私计算创业人的前路在哪里?——七位大咖论道 |GAIR 2021

面对“僧多粥少”的困境,创业公司如何破局?

作者 | 李扬霞

编辑 | 李宗仁

近两年来,国内隐私计算产业迸发式增长,互联网巨头、数据服务商、初创企业纷纷加入隐私计算赛道,运营商、金融机构、数据安全企业、区块链企业等也在不断拓展隐私计算应用。然而,火热的隐私计算产业和市场,依然面临着技术规范、产品应用、市场培育、产业发展等方面问题障碍。

行至2021年并即将接近尾声,在外行还在瞻前顾后的时候,雷锋网联合杨强教授;邀请信工所研究员、博导,信息安全国家重点实验室副主任侯锐担当主持人;邀请一线创业公司里的四家——星云Clustar CTO张骏雪;洞见科技创始人、董事长姚明;上海富数科技有限公司智能决策分析部负责人吴海斌;瑞莱智慧RealAI首席架构师徐世真,分别从上海,北京,深圳赶来GAIR 2021深圳会场;邀请隐私计算一线投资机构基石资本天使基金合伙人黄依群;沸点资本董事总经理马兰现场给隐私计算创业公司的未来把脉。在疫情之中难得的群雄齐聚,我们决定问一些对这个行业从业者真正在思考的问题,解决一些心中的疑惑,寻求一份友商的答案,所以有了此次特别的圆桌呈现。

问题一:2020年和2021年相比,隐私计算市场最明显的变化是什么?

问题二:多行业隐私计算的可复制性局限可能会限制公司的发展,这个问题如何解?

问题三:面对“僧多粥少”的困境,创业公司如何破局?

问题四:隐私计算的行业互联互通何时实现?

问题五:2020年和2021年相比,投资人视角,看到最明显的变化是什么?

问题六:若投资人2022再投隐私计算,只关注什么?

一、侯锐:2020年和2021年相比,隐私计算市场最明显的变化是什么?

毕马威发布的《2021隐私计算行业研究报告》指出,受到大数据融合应用和隐私保护的双重需求驱动,国内隐私计算市场将快速发展,三年后技术服务营收有望触达100亿至200亿元空间,甚至将撬动千亿级数据平台运营收入空间。

如此大的市场空间,最近两年隐私计算逐渐从小众领域为大众熟知,这两年当中隐私计算究竟发生了哪些变化?

1、市场对算力有了迫切的需求

星云Clustar CTO 张骏雪表示,“从没有隐私计算到有隐私计算,再到软件、算力,就发生在最近两三年中,迭代非常之快。”

据透露,从香港科技大学孵化前,星云Clustar的主攻方向是大规模机器学习系统的算力加速。在隐私计算的落地过程中,由于隐私计算巨大的算力代价,严重加大了隐私计算落地成本,制约了该技术的商业化速度。如何通过算力加速技术赋能隐私计算,这是必须要思考的。也就是从今年下半年开始,金融行业已经从聊软件需求变为聊硬件加速,这是因为隐私计算落地的时候需要寻找新的硬件体系结构,加速计算性能。

2、隐私计算客户行业在泛化,技术应用在深化

洞见姚明谈到了,他过去两年来所体会到的市场变化:

第一,隐私计算的客户行业在泛化。去年,我们更多谈论的是金融机构在风控、营销等场景内有使用隐私计算进行业务创新或科技创新的需求。到了今年,我们发现非常多的行业都有了隐私计算需求,因为隐私计算技术能够从数据开放角度和数据应用角度两方面,重构原有数据要素流通的方式。

比如政务领域,当去年数据被纳入国家第五大生产要素之后,国家鼓励数据要素市场进一步地开放和流通,越来越多的地方政府在建设自己的数据能力开放平台,希望通过自己的数据开放赋能当地实体经济的发展,对于开放过程中如何保护数据安全和隐私产生了比较强烈的需求,特别是今年下半年,越来越多的政府平台建设,开始引入隐私计算技术,包括在招投标时希望采购隐私计算模块。

此外,在工业互联网、车联网及生活化的场景,越来越多的机构开始注重在业务场景中引入外部第三方数据,并在引入的过程中保障这些数据的使用安全和客户隐私不泄露等诉求。所以,其实隐私计算的行业客户在发生泛化,越来越多的行业客户在对隐私计算产生诉求,这是第一个变化。

第二,隐私计算技术的应用在深化。去年我们在面对大部分客户的时候,客户会关注:隐私计算到底是什么?隐私计算到底有几种技术路径?但到了今年上半年,大家关注的点是:你的隐私计算技术和其他家相比有什么特点?我能怎么用?

现在,我们发现银行、保险客户会问更精准的业务问题:我用了你的隐私计算技术,能给我带来哪些数据资源?能帮我改善哪些业务效果?比如风控模型的KS值能达到多少,营销的ROI是否能有明显提升?这些说明客户对隐私计算技术由好奇到试用,到希望用它来改善业务,这是客户心态和需求上的同步变化。

3、数据源厂商对隐私计算更感兴趣

富数吴海斌有着近20年的金融经验背景,投入到隐私计算行业的他表示:“隐私计算给金融机构打开了一个新世界的大门。”

过去金融机构传统建模都会结合行内数据或直连外部相关数据,但是随着政策法规的落地,有些数据已经不能使用,但是拓展数据的话,就需要让数据保证可用不可见,既安全又合规。数据源厂商更加青睐隐私计算这一新兴技术,一来可以让数据足不出户,保障数据的安全性,二来,数据价值得到保证和管理,每次调用数据的时候都是透明的、可控的。

同时,吴海斌表示隐私计算也为保护个人信息产生了一定作用,从而对一些行业的运营模式促进了变革,比如富数科技人脸识别案例就是一个典型的创新,“我们基于多方安全计算的人脸识别解决方案,可以让校验数据方并不知晓被检验人的身份,但又能做出是否为本人的正确判断,实现个人隐私的保护。”

这种技术在以前是不可想象的,而富数的研发团队让其在性能上实现了从十几秒到几秒,甚至向毫秒飞跃,这其实已经达到可以商业应用的性能了,由此也开始改变业务模式。

4、用户需求从“大而全”到“小而精”越来越清晰

瑞莱智慧的徐世真分享了他两年来对隐私计算行业的观察。他认为用户需求从“大而全”到“小而精”越来越清晰。

以前用户对隐私计算的场景和能力还处在探索中,追求大而全,MPC、联邦学习都要使用,多种算法和功能都要涵盖,但是如果问将来如何使用,可能还比较迷茫。现在用户已经了解哪个模块可以解决哪个问题,同时针对大数据下的某项具体业务有了较为清晰的需求。

但是随之而来的是小数据变大数据的问题,以前百万级别的数量现在变为亿级或十亿级,TB甚至PB级别。这一问题也是亟需解决的一大难题。

二、侯锐:多行业隐私计算的可复制性局限可能会限制公司的发展,这个问题如何解?

说到商业导向,其实当我们谈商业的时候有一个另外的问题,可复制性。比如在金融领域,这里面存在可复制性和规模化挑战的问题。比如公司A做了工行,但可能到交行就搞不定了,需要另一个。复制性和通用性的潜在局限可能会限制公司的发展,大家对这个问题怎么看?

星云Clustar CTO 张骏雪表示,隐私计算还是相对比较早期的技术,从技术发展到场景应用并没有太长时间,一定程度上存在产品难以复制的问题。星云Clustar在隐私计算领域做了很长时间,我们把自己的业务分成三大块。从上到下,分别是通过隐私计算给客户输送合规合法的数据,帮助他们实现风控、营销等应用;第二,是数据平台、隐私安全、数据底座产品;最后,星云Clustar独特的算力产品。

从行业上看,最上面这一层(通过平台输送数据),相对来说可复制性比较强,比如给一个银行引入新的数据,跟它完成了一定的风控建模,知道这个数据在这个业务上有很好的效果,这个模式复制给另外一个有相同业务的银行金融机构,底层的算力产品是相对标准的硬件,可以本地或云批量化部署到不同机构、平台。

唯一难以标准化的是中间的平台部分,不同机构、领域可能存在不同需求,比如银行A可能在安全方面需要较高,但银行B可能需要在用户界面更易用。所以,星云Clustar的应对方法是,技术栈需要全面,通过相对可复制的产品,抵消不可复制产品带来的问题。

洞见姚明觉得软件产品的标准化程度,一定是伴随行业差异化产生的。在他看来,金融是标准化程度最高的领域了,比如金融风控场景,金融科技从业者都了解其模式比较纯粹、标准化程度极高。如果服务于其他行业,比如工业物联网、制造业、车联网、政务等,它的定制化程度就会更高,差异化和非标准化程度更严重。

他说,如果放开软件市场,从外延去看,当软件部署或软件的行业应用达到一定规模之后,大家都在使用隐私计算作为数据协同、数据交换、数据流通的工具,这些工具之间一旦连接,会构成一张数据智能网络平台,在这张数据智能网络平台,可以衍生的产品丰富程度和标准化程度会进一步提高,它链接了数据,形成了智能,最终提供给客户真实业务场景中的降本增效和业务创新。

因此,姚明认为隐私计算生态的产品和隐私计算软件产品,是两个不同的概念。隐私计算软件平台产品,会随着不同行业应用的扩大化或服务的标准化,快速形成标品的复制能力。但对于隐私计算所构成的数据智能网络市场,他认为它的潜力会更大。

富数吴海斌则觉得,金融这个产品的复制性特别强,所以我们不担心这个问题,每次去银行他们都问,某某家银行怎么做的?一说,觉得好,他们也这么做,所以复制性特别强。所以这个一旦通了,特别是我们给最复杂的银行部署了之后,把最复杂的网络环境全看了一遍之后,我们觉得给这些中小银行进行布设,困难程度更小,业务模式复制过来更容易,所以我对这一点是非常乐观的。

瑞莱智慧徐世真接着表示,隐私计算其实也可以成为其他现有成熟产品的fearture,比如隐私计算数据库、隐私保护大数据分析引擎、隐私保护分析文件系统,刚刚也有厂商提到类似的概念。一个文件系统,本身就是成熟的标品,具有隐私保护功能的文件系统,一定也是标品,也是成熟的。所以一方面,要看它的需求是否规范成熟,是否是少量定制化的。另一方面,隐私计算是否可以结合现在已有的成熟标品去做,这也是我们现在正在考虑的事情。

三、杨强:面对“僧多粥少”的困境,创业公司如何破局?

目前隐私计算行业领域需求出来,一大波公司就会蜂拥而上,如此激烈的竞争,各家公司凭借什么才能胜出?

张骏雪总结了星云Clustar的三点经验:

第一,作为创业公司,最大的特性就是灵活。目前在整个隐私计算赛道里,不仅仅有创业公司,也有一些大厂在入局,相对来说竞争更加激烈。创业公司的作为纯粹的技术供应商能够更加中立。

第二,差异化竞争。找到自己不一样的特色,星云Clustar是一家以算力为核心的隐私算全栈技术提供商,特色在于高性能算力,因此和其他隐私计算厂商更多是竞合关系不是完全的竞争状态。隐私计算作为非常新兴的行业,在商业模式方面与充满了“战争迷雾”,但目前业内公认也是技术壁垒最高的需求,就是加密带来的对更高性能算力的诉求。星云Clustar希望以高性能的算力加速为行业赋能。

第三,坚持做新的科技创新。这些投入可能短期内看不到效益,但是从长期角度来说,一是形成技术壁垒,二是能在充分竞争的市场上找到一些别的出路。

洞见科技姚明认为:现在隐私计算的市场是迷雾期,大家似乎感觉方向是正确的,但路径不够清晰。隐私计算公司首先必须要明确自身是“To 客户”还是“To VC”的公司,然后要找到自己差异化服务的模式和特点。

他提出了隐私计算创业要经历起跑、发力、冲刺三个阶段。在创业长跑过程中,在起跑阶段,凭借的确实是技术,包括算法的先进性、技术的成熟度、产品模式的差异等;但是在发力阶段,凭借的更多是耐力、资源和商务关系,这些都是to B的隐私计算行业不可或缺的要素,如同“木桶理论”,任何一个短板缺失,都会导致你的上限很低;在冲刺阶段,to B要有深刻的行业理解,比如服务于金融,不管是信贷市场还是资管市场,你有多么强的行业积累和行业KnowHow、能给客户提供什么样的端到端的服务能力,决定了你能给客户带来的商业价值有多强。

所以隐私计算也会经历从起跑、到发力、到冲刺的三个阶段,每个阶段所依赖的能力、资源和支持都是各不相同的,每一家隐私计算企业如何在这三个方面做出差异化、做到坚持和有耐心都是很关键的。

他表示:“即使现在的市场是僧多粥少,但任何竞争总是强者为王,总是那些能够坚持,能够踏踏实实服务用户者最后能胜出,这是行业发展的规律,我也深信这一点。”

富数吴海斌认为:“差异化的优势很重要,只要专注一个领域定位好,差异化的优势就凸显出来了,相对来说竞争就会小很多。站在商业化的角度,更多的是做解决方案,而不是介绍技术有多牛,技术固然重要但更重要的解决问题的能力,为用户带来价值的能力。”

徐世真表示:“瑞莱智慧定位于打造安全可控人工智能基础设施,数据安全、算法可控和应用可控,都是新一代安全可控人工智能基础设施的重要组成部分,以AI需求为牵引,也确实诞生出大量数据安全和隐私保护的强需求,比如金融、人脸识别等领域,AI厂商布局隐私计算具有必然性。另外从隐私计算落地角度,AI公司常常自带场景,结合AI的隐私计算也更容易落地,结合AI强大的数据处理和分析能力,也更能实现数据价值闭环。”

据徐世真了解,纯隐私计算的平台,在招标的过程中可能会出现狼多肉少的情况,但是结合具体业务场景的隐私计算需求,市场广阔,竞争压力没有那么大。

总结以上几位嘉宾的发言,可能都不是纯做隐私计算,但是我们也可以从中窥见一个道理,隐私计算不是目的只是一种手段而已,最重要的是商业需求驱动。

四、现场提问:隐私计算的互联互通或许很好实现也或许很难?

会议现场,与会的听众也对台上的嘉宾发起了疑问,作为数据源公司可能要同时接好几家不同的隐私计算平台,为了降低成本隐私计算的互联互通什么时候能实现?目前推进怎么样?

姚明表示,洞见科技、富数科技等隐私计算厂商,都在推进互联互通从标准研制到落地实施的具体工作。到目前为止,不管是政府客户,还是金融机构客户,包括通信运营商类的数据源客户,洞见科技都有互联互通真实的案例和需求的落地。

姚明认为,隐私计算的开源,不管从科研角度还是从实验角度,对整个行业都有着极大的促进和帮助作用。在这个基础之上,如何保证闭源的隐私计算平台既能保持算法的独立性,还能避免从“数据孤岛”到“计算孤岛”的演变路径,让大家共享接入的数据资源,以及独特的算法,这是洞见科技做互联互通这件事的初衷。

他进一步介绍,从标准层面来说,今年下半年,中国信通院首先出台了互联互通整体框架,目前正在进行通信层和协议层标准的制定过程中,应该近期会发布;金标委行标和信安标委国标的互联互通标准也在制定过程中。;除了深度参与了上述标准的制定,洞见科技也联合了几家友商在共同推进隐私计算跨平台互联互通国际标准的制定。

从这件事的终极角度来看,如果大家最终认定隐私计算是跨行业属性的、有不同厂商在为数据智能网络提供服务的话,互联互通就是一件必不可少的事情。也就是说,在整个中国的数据智能市场,如果大家认为最后是有限竞争的市场,而不是由一家垄断来提供跨层级、跨行业、跨区域的服务,互联互通就是必需的。

姚明阐述道,所以我们既要尊重通过开源方式的互联互通,达成从学术到研究生态的建立,也要达成黑盒方式(即闭源模式下)保持算法独立性、资源独特性来实现的互联互通。在这个构建下,洞见科技所推动以及践行的,是以黑盒的方式来做互联互通,即提供算法容器,让除了洞见科技以外第三方隐私计算厂商的算法,可以像网卡的热插拔一样,插在这个算法容器里,以这种方式兼容闭源和开源的互通。目前这种模式也被国家标准、行业标准所认可,从客户角度来说,政府、金融机构和数据源三类客户都有案例实施,目前我们推动的进展还比较理想。

富数吴海斌表示,富数在开放这块做了很多尝试,我们早期跟腾讯、蚂蚁、洞见这边做过很多项目,进行互联互通的尝试。

但是就目前整个行业发展阶段来看,互联互通没有放到最紧急层面,因为大家还有自己生存状况的问题。

目前,我们几家主流厂商也在讨论这个问题,看看通过什么方式能包括自己的IP在里面,同时让甲方或数据乙方都布上一套体系,通用我们不同的算法,能够把这个数据打通,这也是我们乐见其成的,但确实还需要一点时间。

星云Clustar张骏雪补充道,开源也是推动隐私计算互联互通的重要可行路径之一。星云Clustar作为FATE开源社会的技术委员会单位,未来也会在FATE社区中积极推动互联互通的协议、标准等草案。

徐世真表明,短期实现互联互通走容器化、可插拔是比较可行的方式,但长期来看,与安全隐私相关的产品,还是必须要开源。如果不开源,从公信力来说,安全性还是有一定问题,所以我们认为从长期的角度来看,密码学操作符和执行逻辑的开源,会对互联互通方面产生更强的助力。执行逻辑可以用数据流图表示,可以在数据流图这个层面做更高层次的互联互通。但短期在热插拔以及可运行的算法容器层面的互联互通还是比较现实的选择。

徐世真介绍道,参考AI发展路径,瑞莱智慧目前采用的是底层编译器路线,通过数据流图调度执行底层算子。以“底层数据流图”的形式,在集成新机器学习算法时,不用针对每个参与方编写对应的计算逻辑,能够自动改写,而且支持适配上层多种机器学习算法。

五、侯锐:2020年和2021年相比,投资人看到最明显的变化是什么?

1、从不成熟到成熟需要耐心

二十年前,互联网刚刚起来的时候,谁都不知道这到底是什么?当年一头扎进互联网的无外乎不烧钱的,但是如今互联网已经成为基础设施,像水和空气一样,人们的生活离不开它。

基石资本的黄依群从投资人的角度分析了她的体会:“一个科技成果的商业化,必然要走过很漫长的孤独期,摸着石头过河一般找到一个合适的场景落地,生根发芽,慢慢长大。”

她感受到,隐私计算在去年下半年因为出现数据安全问题,而被投资圈提及,当时有投资机构想去星云Clustar交流一下了解隐私计算到底是做什么的、怎么做的、订单是从哪来的?

今年以来,隐私计算这个概念为大家所知,市场上出来一批隐私计算的项目,但所有的项目到今天,成规模的大单其实也不太多,像金融用户比较靠前的应用,也是从POC开始慢慢往前做尝试的,也就是说市场需求因为这些政策的原因被激发起来了。但它真正成为一个成熟的产品,其实现在这个点还没有看到它有正式地爆发。

黄依群认为;“现在大家都管自己叫“隐私计算”,或许明年隐私计算就会更加细分,除了主标题外还应该有一个副标题,更加精细化。”

2、隐私计算呈现积极动态发展

沸点资本马兰从另一个投资人的角度分析了她的体会:大概在2018年的时候,很多金融机构将合规化放在第一位,合规化优于商业化,所以那时候很多以监管作为切入口的企业成长起来。到了2019年,政府正式提出数据化要素这件事,合规化重要,数据安全也同等重要,期间还尝试了最早的数据交易所,发现数据既做资产,又做交易,存在很大的数据安全问题,而隐私计算技术其实是可以协助解决这个这个问题的。所以到了2020年,已经入局的相关企业持续发力,同时又加入了一些新的创业公司,资本也很积极的跟进,其实这恰恰是一种肯定。2020年到2021年,不断有创业者找到新的落地场景,甚至产生收入,所以这个行业还是比较动态的,在往积极、更安全的状态发展。

六、杨强:若投资人2022再投隐私计算,只关注什么?

面对隐私计算崛起的投资风潮,这些手握重金的投资机构是如何看待隐私计算这一赛道的,他们关注的点是什么?这场关于隐私计算投资的背后传递了什么信号?

杨强老师表示:“隐私计算从一个技术发展成为一个产业还需要经历阵痛的过程。”那么作为投资人会更关注哪些方面?

1、种瓜或许得豆

黄依群表示,瑞莱智慧和星云Clustar都是基石资本天使基金投的项目。星云Clustar是2019年投的,当时还没有隐私计算这个明确的主题。其实这两个项目在投之前,主要关注的是团队的论文发表的数量和质量,以及历年来论文被引用的次数和影响因子。

瑞莱过投审会的时候,坦白说我们觉得他们当时的技术非常好,但业务比较散,还不能非常准确地找出他们聚焦的领域,可能金融是非常好的方向,但也许工业、制造领域也是非常好的方向。如今整个瑞莱的隐私计算的平台,包括架构已经非常清晰了。

因此不是看隐私计算的概念进行投资,也看重了这两个团队非常强的技术优势,然后再看到整个团队创业的动力。虽然当时是一个初创团队,可是团队人员的配置已经相对完整,基础研究、产品研发、公司运营、销售等岗位初具雏形。

早期投资的魅力就在于,最开始投的A,可能中间变成了B,最后它上市的时候是C。

随着数字科技的不断发展,作为早期的投资人,可以跟初创公司一起想可以在哪些场景上得到应用。

2、因定位而异

沸点资本马兰表示:“资本关注一个公司的可行性主要包括四个方面:第一技术,是否有行业领先性,是否能解决根本问题,产品是否有标准化的趋势;第二团队;第三拓展市场能力;第四,融资力,也就是持续供给能力。未来两年还会关注政策/标准的趋势,关注公司自上而下的服务和整合能力。”

隐私计算领域涉及到交叉融合科学,包括人工智能、密码学、数据科学等交织在一起,非常重要的两点,一是人才,二是技术。

当技术成熟到一定程度,企业连接到to G、to B时,拓展市场的能力尤为重要,如何让用户信任你的技术、选择你的产品,如何做好持续的优质服务,是另一个要解决的难题。

融资力是让企业、创业者持续成长的能力。隐私计算的爆发大概率还会需要几年的时间,而技术团队等都需要很高的成本去维护,所以要有持续的融资能力,这是比较现实的问题。

当然,不同阶段的投资人,对公司发展的关注点可能会有所不同,比如早期可能更看重团队,成长期可能会偏向拓展市场能力,但最终是对企业能力综合考量的结果。


推荐阅读

GAIR 2021大会首日:18位Fellow的40年AI岁月,一场技术前沿的传承与激辩

2021-12-10

致敬传奇:中国并行处理四十年,他们从无人区探索走到计算的黄金时代 | GAIR 2021

2021-12-09

时间的力量——1991 人工智能大辩论 30 周年纪念:主义不再,共融互生|GAIR 2021

2021-12-12

未来已来,元宇宙比你想象中来得更早丨GAIR 2021

2021-12-12

由于微信公众号试行乱序推送,您可能不再能准时收到AI科技评论的推送。为了第一时间收到AI科技评论的报道, 请将“AI科技评论”设为星标账号,以及常点文末右下角的“在看”。