FHEML究竟是什么?

进阶Apr 02, 2024
本文探索基于完全同态加密的机器学习(FHEML)。这是一种革命性技术,允许在加密数据上执行计算,确保数据隐私和安全。了解FHEML的主要用例,包括外包计算、加密推理和加密训练洞察力,以及当前支持FHEML开发的顶级框架和库。
FHEML究竟是什么?

FHE简介

完全同态加密 (FHE) 代表一类加密技术,旨在允许对加密数据执行有意义的计算。这意味着当此类计算的结果被解密时,它们与在明文数据上执行这些计算所获得的结果一致。

简而言之

fenc 是一些同态加密函数

其中

同态属性保留了加密空间中的计算

在更广泛的 FHE 类别中,我们通常将 FHE 计划分为三种 FHE 计划中的两种,即

  • 某种同态加密(SHE):支持对密文进行有限数量的加法和乘法运算。
  • 完全同态加密 (FHE):支持对密文进行任意数量的乘法和/或加法运算,而不会在解密时损害其完整性。
  • 部分同态加密(部分 HE):支持密文的加法或乘法运算,但不能同时支持两者。

早期使用 FHE 进行机器学习的尝试

对具有完全同态加密 (FHE) 的机器学习 (ML) 的探索直接有助于隐私保护计算,使计算能够在加密数据上执行。

该领域已做出了一些值得关注的贡献,例如 Lauter (2021) 关于将同态加密与 AI 集成用于私人训练和预测的论述,强调了密码学和机器学习的结合,以在利用 AI 的力量的同时保护数据隐私。

此外,一项研究详细介绍了使用 FHE 保护隐私的深度神经网络的工作,该研究重点关注 FHE 和多方计算 (MPC) 的混合模型,用于评估 ML 模型中的非算术函数,突破了维护数据的界限以及计算过程中的模型机密性。

Graepel、Lauter 和 Naehrig (2012) 开创性的论文 ML Confidential 引入了某种同态加密的应用,将 ML 计算安全地委托给计算服务,从而实现确保数据保密的机密 ML 算法。此外,对加密数据的逻辑回归和无监督学习算法的研究例证了传统机器学习方法在加密约束下的实际应用和适应,证明了此类方法在保护数据隐私方面的可行性和效率。这些工作共同强调了机器学习和密码学的关键交叉点,为未来安全、保护隐私的机器学习算法的研究提供了蓝图。

FHEML简介

基于全同态加密的机器学习 (FHEML) 是我们利用全同态加密方案的机器学习算法的一种方式。它允许对加密数据进行计算,确保正在处理的数据的机密性。

FHEML 可以被视为零知识机器学习(ZKML)的补充,后者专注于证明机器学习算法的正确执行,而 FHEML 则强调对加密数据进行计算以维护数据隐私。

FHEML 的本质在于它能够对加密数据进行计算,一旦计算结果被解密,它们就会与对原始明文数据执行计算所获得的结果相匹配。此功能为机器学习应用开辟了广阔的空间,因为它允许算法对加密数据进行操作,而不会损害数据的隐私或安全性。

它可以被可视化为:

加密数据的计算

FHEML 由机器学习算法组成,适用于完全同态加密方案。通过利用这些方案,FHEML 为各种以隐私为中心的机器学习用例打开了大门。在较高层面上,这包括机密计算、加密训练和私人推理等。这些进步不仅增强了数据安全性,还扩大了机器学习在敏感和隐私要求较高的环境中的潜在应用。

FHEML 方向的现有库

针对 FHEML 的库和框架很少,目前还没有编写 FHEML 程序的标准,但用于构建 FHEML 程序的最普遍的框架和库如下:

Concrete-ml 是由Zama创建的库,构建在低级 TFHE 编译器之上。Concrete允许将任意Python代码编译到FHE电路中,使开发人员能够在Python中编写可以对加密数据执行计算的函数。

Concrete-ml 使开发人员能够使用熟悉的机器学习 API(线性模型、基于树的模型、神经网络)可在scikit学院或其他框架中获得。它允许将 PyTorch 模型转换为 FHE 兼容版本,支持基于随机梯度下降的分类器(可以在加密数据等上进行训练)。 Concrete-ml 显著降低了对加密数据实施机器学习操作的准入门槛。

TensealOpenMined社区开发,专注于启用张量(神经网络中的基本单位,可以以各种形式表示或操作数据)的同态运算。构建于微软SEAL(简单加密算术库)之上,Tenseal 提供了一个高效的、可通过 Python 访问的 API,其底层操作是用 C++ 编写的,以增强在加密张量上启用 HE 函数的性能。

PySyft是 OpenMined 的另一项贡献,旨在使用 Python 进行安全且私密的深度学习。它采用 Tenseal 的同态加密功能构建,以增强其隐私保护功能。PySyft 引入了 CKKS 张量,基于CKKS 同态加密方案,能够对实数进行运算并提供近似结果。这超出了同态加密的范围,它还结合了安全多方计算和差异隐私,为保护隐私的机器学习提供了全面的套件。

TF Encrypted 是一个专为 TensorFlow 生态系统中的加密机器学习而设计的框架。特别是通过Keras API 模仿 TensorFlow 体验的 TF Encrypted 有助于对加密数据进行训练和预测。它利用安全的多方计算和同态加密来提供保护隐私的机器学习功能。TF Encrypted 旨在使加密机器学习民主化,让那些没有深厚的密码学、分布式系统或高性能计算背景的人也可以使用它。

FHEML 较少的通用用例

外包计算

由于计算是在加密数据上进行的,现在希望进行计算的一方可以安全地将数据的加密形式共享给第三方进行处理。

加密推理

它有助于加密推理,用户请求的推理不会透露给模型,并且默认情况下保持加密状态,只有用户可以使用其密钥对其进行解密。

加密训练洞察

使企业能够利用加密形式的敏感数据来训练机器学习模型并获得见解。这使组织能够利用其数据来增强运营、制定新策略和改进决策流程,同时确保所涉及数据的最大隐私和安全性。

声明:

  1. 本文转载自【Foresightnews】。原文标题为“WTF is FHEML”。所有版权归原作者【Frank, Foresight News】所有。若对本次转载有异议,请联系【Gate Learn】团队,他们会及时处理。
  2. 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。
  3. Gate Learn 团队将文章翻译成其他语言。除非另有说明,否则禁止复制、分发或抄袭本译文。
即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!
立即注册