加密世界的AI海市蜃楼

新手Apr 23, 2024
文章探讨了人工智能(AI)在加密货币领域的应用及其面临的挑战。文章指出,尽管AI技术在加密货币创新中具有潜力,但其实际应用可能受到市场竞争和监管的影响。文章强调,去中心化本身并不足以为基于加密货币的AI产品提供竞争优势,它们还必须在功能上与中心化产品相匹配。此外,文章提出,许多AI代币的价值可能被夸大,缺乏可持续的需求驱动因素。尽管如此,AI和加密货币之间的交叉点仍然存在广泛的机会,但这些机会的发展和实现可能需要时间
加密世界的AI海市蜃楼
  • 人⼯智能 (AI) 和加密货币之间的交点⾮常⼴泛,但⼈们往往对其知之甚少。我们认为,这个交点的不同⼦部分之间有着截然不同的机遇和发展时间表。

  • 我们普遍认为,对于人工智能产品来说,去中心化本身并不足以带来竞争优势——它还必须在某些其他关键领域达到与中心化产品同等的功能。

  • 我们的逆向观点是,由于人工智能行业受到广泛关注,许多人工智能代币的价值潜力可能被夸大,而且许多人工智能代币在中短期内可能缺乏可持续的需求侧驱动因素。

近年来,人工智能的持续突破,特别是生成式人工智能领域,引起了人们对人工智能行业的高度关注,并为位于两者交叉点的加密项目提供了机会。我们之前在 2023 年 6 月的一份早期报告中介绍了该行业的一些可能性,并指出加密货币的整体资本配置似乎对人工智能方面的投入不足。此后,加密人工智能领域取得了巨大的发展,我们认为,指出可能阻碍其被广泛采用的某些实际挑战非常重要。

人工智能的快速变化使我们对「以加密货币为中心的平台具有独特的优势来颠覆该行业」的大胆主张持谨慎态度;这使得我们认为大多数人工智能代币实现长期和可持续价值增值的道路充满不确定性,特别是对于那些代币经济模型固定的项目来说。 相反,我们认为,鉴于更广泛的市场竞争和监管,人工智能领域的一些新兴趋势实际上可能会使基于加密货币的创新更难被采用。

也就是说,我们相信人工智能和加密货币之间的点是广泛且有不同的机会的,某些⼦部分的采用速度可能会更快,尽管许多此类领域缺乏已经上市的代币。尽管如此,这似乎并没有抑制投资者的兴趣。我们发现,人工智能相关加密代币的表现受到人工智能市场头条新闻的支持,即使在比特币交易走低的日子里,也可能具有积极的价格走势。因此,我们相信许多与人工智能相关的代币可以继续作为人工智能进步的代表进行交易。

人工智能的主要趋势

人工智能领域(与加密人工智能产品相关)最重要的趋势之一是围绕开源模型的持续文化。Hugging Face 上公开了超过 530,000 个模型,供研究人员和用户操作和微调。Hugging Face 在人工智能协作中的作用与依赖 GitHub 进行代码托管或 Discord 进行社区管理(两者都在加密领域广泛使用)没有什么不同。除非出现严重的管理不善,否则这种情况在不久的将来不会发生改变。

Hugging Face 上可用的模型范围从大型语言模型 (LLM) 到生成图像和视频模型,包括 Open AI、Meta 和 Google 等主要行业参与者以及独立开发人员的创作。一些开源语言模型甚至在吞吐量方面比最先进的闭源模型具有性能优势(同时保持可比的输出质量),这确保了开源模型和商业模型之间存在一定程度的竞争(见图 1)。重要的是,我们认为这个充满活力的开源生态系统与竞争激烈的商业部门相结合,已经使不良模型被竞争淘汰的行业成为可能。

第二个趋势是较小模型的质量和成本效益不断提高(早在 2020 年的 LLM 研究以及微软最近的一篇论文中就强调了这一点),这也与开源文化相吻合,以进一步实现高性能、 本地运行的人工智能模型。一些经过微调的开源模型在某些基准下甚至可以超越领先的闭源模型。在这样的世界中,一些人工智能模型可以在本地运行,从而最大限度地去中心化。当然,现有技术公司将继续在云上训练和运行更大的模型,但两者之间的设计空间将需要权衡。

另外,考虑到人工智能模型基准测试的任务日益复杂(包括数据污染和不同的测试范围),生成模型输出最终可能由自由市场中的最终用户进行最佳评估。实际上,最终用户可以使用现有工具来横向比较模型输出以及执行相同操作的基准公司。从各种不断增长的开放式 LLM 基准中可以粗略地了解生成式 AI 基准测试的难度,这些基准包括 MMLU、HellaSwag、TriviaQA、BoolQ 等,每个基准测试不同的用例,例如常识推理、学术主题,以及各种问题格式。

我们在人工智能领域观察到的第三个趋势是,具有强大用户粘性或解决具体业务问题的现有平台能够从人工智能集成中获得不成比例的收益。例如,GitHub Copilot 与代码编辑器的集成增强了本已强大的开发人员环境。将人工智能接口嵌入到其他工具中,从邮件客户端到电子表格再到客户关系管理软件,也都是人工智能的自然用例(例如,Klarna 的人工智能助理完成了 700 名全职客服人员的工作)。

但值得注意的是,在许多此类场景中,人工智能模型不会带来新平台,而只会增强现有平台。其他在内部改进传统业务流程的人工智能模型(例如,Meta 公司的 Lattice 系统,它在苹果推出 App Tracking Transparency 功能后帮助其广告性能恢复到了原有水平)也通常依赖于专有数据和封闭系统。这些类型的人工智能模型可能会保持闭源状态,因为它们垂直集成到核心产品中并使用专有数据。

在人工智能硬件和计算领域,我们看到了另外两个相关趋势。首先是计算用途从训练到推理的转变。也就是说,当人工智能模型首次开发时,大量计算资源被用来通过向模型提供大型数据集来「训练」模型。现在已经转向部署和查询模型。

NVIDIA 2024 年 2 月的财报电话会议显示,他们大约 40% 的业务用于推理,Satya Nadella 在 1 月前一个月的微软财报电话会议上也发表了类似言论,指出他们的 Azure AI「大部分」使用都是用于推理。随着这种趋势的持续,我们认为寻求模型货币化的实体将优先考虑能够以安全和生产就绪的方式可靠运行模型的平台。

第二个主要趋势是围绕硬件架构的竞争格局。Nvidia 的 H200 处理器将于 2024 年第二季度开始上市,下一代 B100 预计性能将进一步翻倍。此外,谷歌对其自身张量处理单元(TPU)和 Groq 较新的语言处理单元(LPU)的持续支持也可能在未来几年作为该领域的替代品增加其市场份额(见图 2)。此类发展可能会改变人工智能行业中的成本动态,并且可以使云服务提供商受益,他们可以快速转向、批量采购硬件并设置任何相关的物理网络要求和开发人员工具。

总体而言,人工智能领域是一个新兴且快速发展的领域。ChatGPT 于 2022 年 11 月首次向市场发布不到 1.5 年(尽管其底层 GPT 3 模型自 2020 年 6 月以来就已存在),此后该领域的快速发展令人震惊。尽管一些生成式人工智能模型背后的偏见存在一些值得怀疑的行为,但我们可以看到表现较差的模型被市场淘汰,转而青睐更好的替代方案。该行业的快速发展和即将出台的法规的可能性意味着,随着新解决方案的出现,该行业的问题正在定期发生变化。

对于这样一个快速创新的领域来说,经常被吹捧的「去中心化解决 [XXX]」作为已成定局的一揽子补救措施还为时过早。它还抢先解决了一个可能不一定存在的中心化问题。现实情况是,通过许多不同公司和开源项目之间的竞争,人工智能行业在技术和业务垂直领域已经实现了很大程度的去中心化。此外,由于其决策和共识过程的性质,真正的去中心化协议在技术和社会层面上的进展速度比中心化协议慢。这可能会对在人工智能发展的现阶段寻求平衡去中心化和具有竞争力的产品造成障碍。也就是说,加密货币和人工智能之间在较长的时间范围内存在一些可以有意义地实现的协同效应。

确定机会范围

从广义上讲,我们将人工智能和加密货币的交点分为两大类。第一类是人工智能产品改善加密行业的用例。这包括从创建人类可读的交易和改进区块链数据分析,到利用链上模型输出作为无许可协议的一部分等场景。第二类是加密货币旨在通过分散的计算、验证、身份等方法颠覆传统人工智能管线的用例。

前一类业务相关场景的用例是明确的,我们相信,尽管仍然存在重大技术挑战,但在更复杂的链上推理模型场景中也有长期前景。集中式人工智能模型可以像任何其他以技术为中心的行业一样改善加密货币,从改进开发人员工具和代码审计到将人类语言转化为链上行动。但这一领域的投资通常通过风险投资流入私营公司,因此通常被公共市场忽视。

然而,对于加密技术如何颠覆现有的人工智能管线这一说法,其意义和好处 对我们来说还不太确定。后一类的困难不只是技术挑战(我们认为从长远来看通常可以解决),并且也是与更广泛的市场和监管力量的艰苦斗争。最近对人工智能和加密货币的大部分关注都集中在这一类别上,因为这些用例更适合拥有流动性代币。这是我们下一节的重点,因为目前而言与加密货币中的集中式人工智能工具相关的流动性代币相对较少。

加密货币在人工智能管线中的作用

冒着过于简单化问题的风险,我们认为加密货币在人工智能管线的四个主要阶段对人工智能的潜在影响:

1、数据的收集、存储和处理,

2、模型的训练和推理,

3、模型输出的验证,

4、跟踪人工智能模型的输出。

这些领域已经出现了大量新的加密人工智能项目,尽管许多项目在中短期内将面临需求侧生成以及来自中心化公司和开源解决方案的激烈竞争两大严峻挑战。

Proprietary Data

数据是所有人工智能模型的基础,并且可能是专业人工智能模型性能的关键区别因素。历史区块链数据本身是模型的新的丰富数据源,而像 Grass 这样的某些项目也旨在利用加密激励措施从开放互联网中管理新的数据集。在这方面,加密有机会提供行业特定的数据集,并激励创建新的有价值的数据集。(我们认为,Reddit 最近与 Google 达成的每年 6000 万美元的数据许可协议预示着数据集货币化的未来。)

许多早期模型(例如 GPT 3)混合使用了 CommonCrawl、WebText2、书籍和维基百科等开放数据集,以及 Hugging Face 上免费提供的类似数据集(目前托管超过 110,000 个选项)。然而,可能是为了保护商业利益,许多最近的闭源模型尚未公布最终的训练数据集组成。专有数据集的趋势,特别是在商业模型中,将继续保持下去,并提高数据许可的重要性。

现有的集中式数据市场已在帮助弥合数据提供商和消费者之间的差距,使新的去中心化数据市场解决方案的机会空间夹在开源数据目录和企业竞争对手之间。如果没有法律结构的支持,纯粹去中心化的数据市场还需要构建标准化的数据接口和管道,验证数据完整性和配置,并解决其产品的冷启动问题——并同时平衡市场参与者之间的代币激励。

另外,去中心化存储解决方案最终也可能在人工智能行业找到一席之地,尽管这方面仍然存在诸多挑战。一方面,用于分发开源数据集的管线已经存在并被广泛使用。另一方面,许多专有数据集的所有者有严格的安全性和合规性要求。事实上目前不存在在 Filecoin 和 Arweave 等去中心化存储平台上托管敏感数据的监管途径。许多企业仍在从本地服务器过渡到集中式云存储提供商。在技术层面上,这些网络的去中心化性质目前也不符合敏感数据存储的某些地理位置和物理数据孤岛要求。

虽然去中心化存储解决方案和成熟云提供商之间的价格比较,表明每个去中心化的存储单元更便宜,但这忽略了重大的前提。首先,与在提供商之间迁移系统相关的前期成本需要考虑到日常运营费用之外。其次,基于加密的去中心化存储平台需要与过去二十年发展的成熟云系统更好的工具和集成相匹配。从业务运营的角度来看,云解决方案还具有更可预测的成本,提供合同义务和专门的支持团队,并且还拥有大量现有的开发人员人才。

还值得注意的是,与「三大」云提供商(亚马逊网络服务、谷歌云平台和微软 Azure)的粗略比较是不完整的。还有数十家成本较低的云公司也在通过提供更便宜的基础服务器机架来争夺市场份额。我们认为,对于成本敏感的消费者来说,这些才是真正的近期主要竞争对手。

也就是说,最近的创新,如 Filecoin 的数据计算和 Arweave 的 ao 计算环境,可能会为即将到来的利用不太敏感数据集的绿地项目或尚未成为供应商的对成本最敏感(可能规模较小)的公司发挥作用。

因此,虽然数据空间中肯定存在新型加密产品的空间,但最近的技术颠覆将发生在它们可以产生独特价值主张的地方。去中心化产品与传统和开源竞争对手正面竞争的领域将需要更多时间才能取得进展。

Training and Inferencing Models

加密行业的去中心化计算(DeComp)领域也旨在成为集中式云计算的替代方案,部分原因是现有的 GPU 供应紧张。针对这一短缺问题提出的一种解决方案是在集体网络中重新利用闲置计算资源,并降低集中式云提供商的成本,Akash 和 Render 等协议应用了类似的解决方案。根据初步指标,此类项目在用户和供应商方面的使用似乎都在增加。例如,今年迄今为止,Akash 的活跃租约(即用户数量)增加了三倍(参见图 3),这主要是由于其存储和计算资源的使用量增加所致。

然而,自 2023 年 12 月的峰值以来,支付给网络的费用实际上有所下降,因为可用 GPU 的供应超过了这些资源的需求增长。也就是说,随着越来越多的提供商加入网络,租赁的 GPU 数量(按比例来看,这似乎是最大的收入驱动因素)已经下降(参见图 4)。对于计算定价可以根据供需变化而变化的网络,尚不清楚如果供应方的增长超过需求方的增长,最终会在哪里出现对原生代币的持续的、使用驱动的需求。尽管此类变化的长期影响尚不明确,未来可能需要重新审视此类代币经济模型,以针对市场变化进行优化。

在技术层面上,去中心化计算解决方案也面临着网络带宽限制的挑战。对于需要多节点训练的大型模型,物理网络基础设施层起着至关重要的作用。数据传输速度、同步开销以及对某些分布式训练算法的支持意味着需要特定的网络配置和自定义网络通信(如 InfiniBand)来促进高性能执行。当超过一定的集群规模时,则很难以分散的方式实现

总的来说,去中心化计算(和存储)的长期成功面临着来自中心化云提供商的激烈竞争。任何运用至少都将是一个类似于云采用时间表的长期过程。鉴于去中心化网络开发的技术复杂性不断增加,加上缺乏类似的可扩展开发和销售团队,完全执行去中心化计算愿景将是一个艰难的旅程。

Validating and Trusting Models

随着人工智能模型在生活中愈发重要,人们越来越担心它们的输出质量和偏差。某些加密项目旨在通过利用一套算法来评估不同类别的输出,找到一个去中心化的、基于市场的解决方案来解决这个问题。然而,上述围绕模型基准测试的挑战,以及明显的成本、吞吐量和质量权衡,使得面对面的比较具有挑战性。BitTensor 是此类中最大的专注于人工智能的加密货币之一,旨在解决这个问题,尽管存在许多突出的技术挑战可能会阻碍其广泛采用(参见附录 1)。

另外,无需信任的模型推理(即证明模型输出实际上是由所声称的模型生成的)是加密人工智能重叠领域的另一个活跃研究领域。然而,随着开源模型规模的缩小,此类解决方案可能会面临需求方面的挑战。在模型可以在本地下载和运行并且通过完善的文件哈希/校验和方法验证内容完整性的世界中,去信任推理的作用不太明确。诚然,许多 LLM 还无法通过手机等轻型设备进行培训和操作,但功能强大的台式计算机(如用于高端游戏的计算机)已经可以用于运行许多高性能模型。

Data Provenance and Identity

随着生成式人工智能的输出与人类的输出越来越难以区分,辨识和跟踪 AI 生成内容的重要性也逐渐成为人们关注的焦点。GPT 4 通过图灵测试的速度是 GPT 3.5 的 3 倍,而且我们几乎不可避免地会在某一天无法区分机器人和人类。在这样的世界中,确定在线用户的身份以及对人工智能生成的内容加水印将是关键功能。

像 Worldcoin 这样的去中心化标识符和身份证明机制旨在解决之前在链上识别人类的问题。同样,将数据哈希发布到区块链可以通过验证内容的时间标志和来源来帮助确定数据来源。然而,与前面的部分类似,我们认为必须权衡基于加密的解决方案的可行性与集中式替代方案。

中国等一些国家将网络人格与政府控制的数据库联系起来。尽管世界其他地区的中心化程度并不高,但了解你的客户 (KYC) 提供商联盟也可以提供独立于区块链技术的身份证明解决方案(可能与构成了当今互联网安全的基石的受信任的证书颁发机构类似)。目前还正在进行人工智能水印研究,以在文本和图像输出中嵌入隐藏信号,以便算法能够检测内容是否是人工智能生成的。许多领先的人工智能公司,包括微软、Anthropic 和亚马逊,都公开承诺在其生成的内容中添加此类水印。

此外,许多现有的内容提供商已经被委托严格记录内容的元数据,以满足合规要求。因此,用户通常会委托社交媒体帖子关联的元数据(但不信任其截图),即使它们是集中存储的。这里需要注意的是,任何基于加密的数据来源和身份解决方案都需要与用户平台集成才能广泛有效。因此,虽然用于证明身份和数据来源的基于加密的解决方案在技术上是可行的,但我们也认为它们的采用并不是既定的,最终将取决于业务、合规性和监管要求。

Trading the AI Narrative

尽管存在上述难点,但从 2023 年第四季度开始,许多人工智能代币的表现优于比特币和以太币,也优于英伟达和微软等主要人工智能股票。这是因为人工智能代币通常受益于更广泛的加密市场以及相关人工智能新闻头条的强劲相关表现(参见附录 2)。因此,即使比特币价格下跌,以人工智能为中心的代币价格也可能上涨波动,这会导致比特币下跌期间出现上行波动。图 5 直观地显示了 AI 代币在比特币交易下跌期间的分散情况。

总体而言,人工智能叙事贸易中仍然缺少许多短期持续需求驱动因素。由于缺乏明确的采用预测和指标,导致了广泛的模因式投机,这可能无法长期持续下去。最终,价格和效用将会趋同——悬而未决的问题是这需要多长时间,以及效用是否会上升以满足价格,反之亦然。也就是说,持续建设的加密货币市场和表现出色的人工智能行业可能会在一段时间内维持强大的加密货币人工智能叙事。

结论

加密货币在人工智能中的作用并不是凭空存在的——任何去中心化平台都在与现有的中心化替代方案相竞争,必须在更广泛的业务和监管要求背景下进行分析。因此,纯粹为了「去中心化」而取代中心化提供商不足以推动有意义的进步。生成式人工智能模型已经存在了几年,并且由于市场竞争和开源软件,已经保留了一定程度的去中心化。

本报告中反复出现的一个主题是,承认基于加密的解决方案虽然在技术上通常是可行的,但仍然需要大量的工作才能达到与更集中的平台相同的功能,而平台并不会在未来的发展中停滞不前。事实上,由于共识机制的原因,集中式开发通常比分散式开发更快,这可能会给人工智能这样快速发展的领域带来挑战。

有鉴于此,人工智能和加密货币的交叠仍处于初级阶段,随着更广泛的人工智能领域的发展,未来几年可能会迅速发生变化。正如加密行业许多人目前所设想的那样,去中心化的人工智能未来并不能得到保证——事实上,人工智能行业本身的未来在很大程度上仍然不确定。因此,我们认为谨慎的做法是谨慎地驾驭这样的市场,更深入地研究基于加密货币的解决方案以及如何真正提供更好的替代方案,或者理解潜在的交易叙事。

原文链接

声明:

  1. 本文转载自[theblockbeats],原文标题“Crypto’s AI Mirage”,著作权归属原作者[David Han],如对转载有异议,请联系Gate Learn团队,团队会根据相关流程尽速处理。

  2. 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。

  3. 文章其他语言版本由Gate Learn团队翻译, 在未提及Gate.io的情况下不得复制、传播或抄袭经翻译文章。

即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!
立即注册