在充分保护隐私的同时尽可能多地挖掘数据价值,不仅理论上可行,实践中也有越来越多的团队为之努力并取得进展。
数字经济时代,数据作为新的生产要素和战略性资源,是科技进步、政策制定和经济发展的重要动力。但是,只有在隐私和安全得到保障的前提下,数据的价值才能最大化。
今年1月,工信部、国家网信办、国家发改委等16部门印发《关于促进数据安全产业发展的指导意见》,明确提出加强隐私计算、数据流转分析等关键技术攻关,加强数据质量评估、隐私计算等产品研发。
隐私计算产业也在加速崛起。中国信息通信研究院报告指出,预计到2025年,中国的隐私计算市场规模将达到百亿元人民币。
隐私计算技术发展情况
根据目前中国业界共识,隐私计算主要分为以安全多方计算为代表的密码学路径、以机密计算为代表的可信执行环境(硬件)路径,以及以联邦学习为代表的人工智能路径。
安全多方计算(SecureMulti-PartyComputation)
机密计算(ConfidentialComputing)
联邦学习(FederatedLearning)
联邦学习由Google在2016年提出,其核心思想是允许两个或多个参与方在数据不出域的情况下,协同完成模型的构建与使用,强调「数据不动模型动,数据可用不可见」,适用于参与用户多、数据特征多且分布广泛的联合计算应用场景。根据参与计算的数据在数据方之间分布的情况不同,可以分为横向联邦学习、纵向联邦学习和联邦迁移学习。通常情况下,联邦学习需要与其他隐私保护技术联合使用,才能在计算过程中实现对数据的保护。
中国互联网巨头隐私计算产业落地情况
目前,隐私计算正处于飞速发展阶段,单点技术持续优化,在实际应用中呈现出多技术融合的态势,以应对不同场景下的数据安全和隐私保护需求。根据Gartner《2022隐私技术成熟度曲线》报告,预计未来5-10年隐私计算技术会被大规模商业化应用,到2025年60%以上的大型组织将在数据分析、商业智能或云计算中使用一种或多种隐私计算技术。
随着技术增益与商业落地场景逐步丰满,大数据、人工智能、区块链、云服务等类型的企业纷纷入局隐私计算,各类玩家在积极推高技术渗透率与拓展应用边界的过程中,一同构成中国隐私计算产业图景。
其中,腾讯、蚂蚁、阿里、百度、字节跳动等互联网巨头有强大的技术实力,庞大的用户群与合作伙伴,坐拥海量高价值数据,是隐私计算入局者中不可忽视的力量。这些企业不仅能推动隐私计算技术加速发展,催生出新的产业机会与发展空间,还有望重塑企业与用户之间的关系,甚至影响行业力量对比与市场格局。
腾讯
腾讯AngelPowerFL隐私计算团队也是国内较早开展隐私计算与联邦学习技术研究和应用的团队,在大数据、分布式计算、分布式机器学习、分布式消息中间件、多方安全计算、应用密码学等领域都有丰富的研发和应用经验,已发表近10篇隐私计算研究论文,提交了60多件隐私计算技术发明专利申请,有多个商用隐私计算和联邦学习的平台产品目前已经通过腾讯云对外开放。团队连续三年获得隐私计算业内最具影响力的权威奖项,分别是2020年iDASH国际隐私计算大赛可信计算赛道冠军、2021年iDASH联邦学习赛道冠军、2022年iDASH同态加密赛道冠军。
蚂蚁
蚂蚁集团从2016年起布局隐私计算,在技术研发、产品服务、生态共建等方面取得诸多成果。蚂蚁拥有业内第一的隐私计算专利数量,并且提出了可信密态计算、受控匿名化等新的技术。产品和服务方面,开源可信隐私计算框架隐语(SecretFlow),支持目前几乎所有主流的隐私计算技术,并且积极支持互联互通;开源可信执行环境隐私计算操作系统Occlum,兼容Linux环境的API,使现有应用几乎不需改造即可运行于可信执行环境,大幅降低TEE应用开发门槛;商用方面,蚂蚁隐私计算一体机,提供集软硬件全栈可信于一体的系统平台,为组织机构之间的数据联合计算提供一站式安全解决方案;大规模多方安全计算商用平台蚂蚁链摩斯,是业内首家通过多方安全计算产品测评(信通院MPC测评)和首批通过金标委MPC测评的产品,截止2022年2月已服务150余家行业客户。生态方面,蚂蚁也积极推动国际国内的行业标准制定,是多项重要标准的牵头机构。
阿里
百度
百度2012年便发布《数据安全策略》,2018年成立数据隐私保护委员会,目前隐私计算作为底层基础技术,在百度智能云、百度安全、百度超级链等平台上部署,并结合多种技术推出解决方案实现应用落地。百度智能云还与区块链平台融合,通过将区块链技术纳入云计算与隐私计算的过程,推动隐私计算在各种场景中落地。百度大脑旗下的大数据服务平台百度点石,基于联邦学习、多方安全计算、可信执行环境等主流隐私计算技术,安全高效实现数据赋能,助力客户提升数据价值。百度点石安全计算平台(MesaTEE)是百度安全在隐私计算面向企业落地的重要平台。基于百度飞桨开发的开源联邦学习框架PaddleFL,让企业之间的合作能够在数据层面安全开展。PaddleFL提供多种联邦学习策略及其在计算机视觉、自然语言处理、推荐算法等领域的应用。
字节跳动
结语
随着数据安全合规流通成为必然,隐私计算作为当下实现数据「可用不可见」的唯一技术解,对未来的科技产业以及实体经济的关键领域将产生重要影响。除了典型的金融、医疗等场景,隐私计算也被探索用于越来越多的行业与领域。
我们已经看到,充分释放数据的价值能够推动革命性的创新,试想一个个比ChatGPT更加智能的产品进入生活,了解我们的兴趣与习惯,提供定制化服务,让工作和生活变得前所未有的便利与个性化。在这一过程中,隐私计算将作为新技术应用中不可或缺的一部分,让数据在创造价值的同时保持安全可控,守护人们对隐私保护的合理预期。
参考资料
Gartner《2022年新兴技术成熟度曲线》
中国信息通信研究院《隐私计算白皮书(2022年)》
《网络安全技术和产业动态》2022年第10期,总第28期
CBInsightsChina《2022年中国隐私计算技术与市场发展研究报告》