亚马逊主导了第一个云时代人工智能的繁荣已经开启了云2.0,而这一次,该公司并没有领先一步

作者专栏 编辑:admin 日期:2025-04-13 02:21:45 17人浏览

  

  亚马逊主导了第一个云时代人工智能的繁荣已经开启了云2.0,而这一次,该公司并没有领先一步

  云1.0时代由亚马逊网络服务主导。

  生成式人工智能的繁荣开启了云2.0时代。

  亚马逊这次没有领先优势,需要帮助才能赶上英伟达。

  NEW LOOK注册获取今日市场、科技和商业领域最重要新闻的内幕消息——每日提供。阅读预览广告

  当你盖房子的时候,你可以用不同的方法来做。

  你可以建造所有你需要的工具,然后徒步到森林里去砍木头,然后把它变成你最终的结构。

  或者,你可以去家得宝(Home Depot)买已经砍过的木材,以及所有你需要的钉子、锤子和其他设备。

  或者,你可以付钱给承包商来做大部分的工作。

  广告广告

  在过去的15年里,亚马逊网络服务(Amazon Web Services)成为任何想要在网上建立东西的人的首选承包商。一个网站,一个应用,一个商业软件服务。如今,很少有开发人员冒险进入数字森林,砍掉自己的半导体,构建自己的服务器和数据中心。AWS为您完成了这一切,并提供了您需要的大部分工具。

  正是这样,AWS才从2006年的一个边缘想法变成了一个价值800亿美元的企业,拥有丰厚的利润空间和庞大而有粘性的客户群。这是一个技术平台的本质。

  生成式人工智能的兴起创造了一些技术专家所称的云2.0。未来几年,一系列新的硬件、软件、工具和服务将为人工智能应用提供动力。在这个新世界,哪家公司将成为首选的承包商?当你在建造你的人工智能房子时,你会向谁寻求所有的数字木材和正确的工具,这些工具可以很好地协同工作来完成工作?

  目前,AWS在这方面还不像是领导者,而英伟达则遥遥领先。

  广告广告

  英伟达设计和销售的gpu是几乎所有创建大型语言模型和其他大型人工智能模型的人的首选芯片。十多年前,当吴恩达和其他人发现gpu可以并行处理许多计算时,人工智能研究人员就开始使用这些组件。相比之下,AWS在近十年后的2020年12月推出了用于人工智能模型训练的Trainium GPU。

  在那十年里,英伟达还围绕其gpu建立了一个平台,帮助人工智能开发人员完成他们的工作。该公司创建了编译器、驱动程序、操作系统、工具、代码库、培训笔记和视频等等。这个平台的核心是一种叫做CUDA的编程语言。

  现在有超过400万注册的Nvidia开发人员使用CUDA及其相关工具。这一数字高于2020年8月的200万,以及两年前的100万。AWS目前最接近的产品叫做Neuron。根据其Github页面,该版本于2019年发布。CUDA于2007年问世。

  英伟达(Nvidia)前高管迈克尔?道格拉斯(Michael Douglas)最近向伯恩斯坦(Bernstein)的分析师谈到了这一切,他解释说,这家芯片制造商的软件和工具远远领先于竞争对手:

  广告广告

  在CUDA之上有250个软件库可供开发人员使用。库是预先构建的代码,用于执行处理视频或音频或在图形中执行某些功能。

  英伟达还为开发人员提供了400个预先构建的模型,用于图像识别和语音合成等人工智能任务。

  这些库和模型与流行的软件框架(如PyTorch, TensorFlow, Windows和VMware)编织在一起。

  所有这些都堆放在65个平台上。平台提供了大多数其他软件开发人员在数据中心或边缘环境中使用人工智能进行操作所需的功能。

  道格拉斯说:“这就意味着,如果你想盖一栋房子,你就得去森林里砍倒自己的树,制作自己的工具,或者去家得宝买木材和工具,把所有东西组装在一起。”

  这里的另一个关键点是:大多数AI开发人员已经知道如何使用CUDA和Nvidia gpu。所有的技巧、技巧和其他快捷方式都嵌入在社区中。

  可以说,英伟达已经创建了一个人工智能云平台——就像AWS在云1.0时代所做的那样。随着我们进入云2.0时代,这对AWS或其他任何人来说都很难打破。

  广告广告

  “英伟达长期以来一直押注于人工智能。他们的软件成熟度是其他供应商无法比拟的,”人工智能初创公司OctoML的首席执行官兼联合创始人路易斯·塞泽(Luis Ceze)表示。“随着人工智能定制芯片的出现,我们迫切需要一个成熟且易于使用的系统软件堆栈。”

  不过,不要把AWS排除在外。就像Andy Jassy和Adam Selipsky一直说的,现在还为时尚早。詹姆斯·汉密尔顿(James Hamilton)是AWS云基础设施方面的天才,他可以与英伟达一较高下,尽管这家芯片制造商已经遥遥领先。

  AI2 Incubator技术总监、Madrona Venture Group合伙人奥伦·埃齐奥尼(Oren Etzioni)表示:“由于在软件方面的优势,英伟达锁定了市场。”“有一种观点认为,这个窗口正在开始关闭。”

  云2.0的竞赛真正拉开了序幕,当时亚马逊宣布向一家名为Anthropic的人工智能初创公司投资高达40亿美元。这家总部位于旧金山的公司规模相对较小,其中的研究人员帮助开发了GPT核心技术,而这正是当今生成式人工智能热潮的核心。Anthropic有一个最强大的大型人工智能模型,叫做Claude。

  广告广告

  Anthropic现在将使用AWS内部的Trainium和Inferentia芯片来构建、训练和部署其未来的人工智能模型,两家公司将合作开发未来的Trainium和Inferentia技术。

  这里的关键部分是Anthropic和AWS之间的反馈循环。Anthropic的那些人工智能先驱们现在致力于使用AWS的gpu,以及所有相关的软件和工具。如果这里缺乏AWS, Anthropic可以帮助确定最大的漏洞,并提出填补这些漏洞的方法。

  为了赶上英伟达,AWS真的需要一个像这样的大牌开发者。只需要10亿到40亿美元。

  Ceze说:“亚马逊需要一个使用自己芯片的主要人工智能公司。“亚马逊能够展示Anthropic在亚马逊芯片上运行他们的工作负载是一个胜利。他们希望其他构建人工智能模型的人相信,芯片是好的,软件是成熟的。”

  广告广告

  制造自己的人工智能芯片是赢得云2.0竞赛的一个非常重要的优势。如果AWS不得不继续购买英伟达的gpu,它将不得不向英伟达支付保证金。(一些人工智能专家称之为“英伟达税”)。这将使AWS的Trainium和interentia云服务的运营成本更高。

  相反,如果AWS能够生产自己的人工智能芯片,那么它就可以把英伟达的利润率留给自己。这意味着它可以提供更具成本效益的人工智能训练和推理云服务。

  最近在西雅图举行的AWS活动上,AWS首席执行官塞利普斯基反复强调了这一信息:AWS的人工智能云服务将基于“性价比”而具有竞争力。这位首席执行官表示,这意味着在AWS上构建人工智能模型应该更有效。

  在云1.0时代,AWS在一定程度上是通过2015年收购Annapurna Labs实现的。这家初创公司帮助亚马逊为其云数据中心设计了自己的引力子cpu。突然之间,AWS不再需要从英特尔购买那么多昂贵的至强芯片了。这是使AWS成为如此有竞争力和成功的云提供商的一个重要因素。

  广告广告

  但问题是:你可以拥有出色的人工智能芯片和优惠的价格,但会有人放弃使用英伟达gpu和CUDA平台吗?如果他们不这样做,AWS可能不会像在云1.0中那样赢得云2.0。

  这让我们回到了房屋建造的类比。目前,英伟达可能提供了完成这项工作的最佳木材和工具组合。如果你已经在用这个了,你能轻松切换吗?

  我问了Lamini AI的联合创始人Sharon Zhou。她的创业公司花了几个月的时间从零开始建立一个数据中心,帮助客户训练人工智能模型。当它在9月份发布时,令人惊讶的是Lamini使用的是AMD的gpu而不是英伟达的芯片。

  转换得怎么样?周说Lamini甚至都没有尝试,因为这太难了。

  广告广告

  “我们从来没有换过。我们在AMD上创立了公司。这就是为什么它有效,”她说。“转换将比从头开始更困难。如果你想转换,你就必须对整个代码库进行重大重构。”

  她还提到了前Nvidia高管Douglas的观点:AI库和其他CUDA相关的框架和工具更加发达。

  “如今,图书馆与英伟达紧密结合,”周说。“你需要重新实现处理大型语言模型的基本能力。除了基础之外,您还需要为其他公共库这样做。”

  Etzioni表示,英伟达与人工智能开发商仍有两个主要的锁定。

  广告广告

  首先是PyTorch,一个流行的AI框架,对CUDA和Nvidia gpu进行了很好的优化。Ceze运营的初创公司OctoML正在进行一系列粗略的技术修复,希望能让人工智能开发人员在未来更容易地在不同的框架和平台上使用任何GPU,包括AWS的产品。

  其次,一旦你可以有效地连接到另一个人工智能软件堆栈,这个替代平台必须至少和CUDA一样好。Etzioni说:“目前还没有其他选择。”

  根据Etzioni的说法,AMD可能是目前最接近英伟达的公司。这家芯片制造商拥有软件平台ROCm,可以让人工智能开发人员访问流行的语言、库和工具。

  不过,他没有提到AWS或Trainium。

分享到

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。