16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

首页 热门新闻 最新资讯

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

热搜大全 2023-11-30

最强云计算、最快 GPU,联手出大招了!

就在刚刚,云计算霸主亚马逊云科技英伟达宣布:

推出首款云 AI 超级计算机,结合了英伟达 H200 Grace Hopper 超级芯片和亚马逊 UltraCluster 扩展功能。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

据悉,该合作项目代号为Project Ceiba,而这个超级计算机是配备了 H200 NVL32 与 Amazon EFA 互连技术的大规模系统,将部署在亚马逊云科技之上。

它共计搭载了16384 颗英伟达 H200 超级芯片,能够处理 65 exaflops 速度等级的 AI 运算。

为了这个合作项目,老黄也是亲自来到亚马逊云科技年度盛会 re:Invent 的现场站台,重视程度可见一斑。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

左:亚马逊云科技 CEO:Adam Selipsky;右:英伟达 CEO:黄仁勋

与此同时,亚马逊云科技也成为了英伟达 H200 Grace Hopper 超级芯片的第一个大客户。

而之所以两大巨头要这般合作,双方的目标也是非常明确——剑指生成式 AI

亚马逊云科技 CEO Adam Selipsky 在现场表示:

我们与英伟达合作了 13 年,推出了最广泛的英伟达 GPU 解决方案可用于各种工作负载,包括绘图、游戏、HPC 高性能计算、机器学习,以及现在的生成式 AI。

我们将会让亚马逊云科技成为运行 GPU 的最佳云端环境。

黄仁勋也对生成式 AI 与云计算发表了他的观点:

生成式 AI 正改变各种云端负载,为多元内容创作在底层注入加速计算动能。

我们共同目标是为每个客户提供具有成本效益、先进生成式 AI,为此英伟达与亚马逊云科技在整个计算堆栈展开合作,横跨 AI 基础设施、加速库、基础模型以及生成式 AI 服务。

而这次强强联手的合作,也仅仅是亚马逊云科技 re:Invent 活动中的一隅。

现在,我们就来一同看下更多的重磅发布。

亚马逊云科技升级 AI 芯片

除了与英伟达展开合作之外,亚马逊云科技自家的芯片也迎来了大升级。

首先便是发布了升级后的通用 AI 芯片——Graviton4

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

据了解,与上一代 Graviton3 相比,Graviton4 的计算性能提高了 30%,核心数量增加了 50%,内存带宽增加了 75%。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Graviton4 带来的一个新转变之一,便是通过对所有快速物理硬件接口的全面加密,这就显著提升了它的安全性。

亚马逊云科技透露,这款芯片将被应用于内存优化型的 Amazon EC2 R8g 实例,帮助客户提升高性能数据库、内存缓存和大数据分析工作的效率。

而且,R8g 实例的大小更大,其 vCPU 和内存容量比前一代的 R7g 实例最多增加了三倍。

搭载 Graviton4 的电脑预计在接下来的几个月内上市。

亚马逊云科技进一步表示:

自从大约五年前推出 Graviton 项目以来,他们已经生产了超过 200 万个 Graviton 处理器。

而且,亚马逊云科技 EC2 的前 100 位用户都已经选择使用 Graviton,这证明了其在市场上的受欢迎程度。

亚马逊云科技在大会中带来的第二款升级芯片,则是Trainum2

如其名,这款芯片的主要用途就是针对拥有超大参数模型的训练。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

相比于上一代 Trainium1,Trainum2 在速度上快出了 4 倍,同时在能效方面也有 2 倍的提升。

在亚马逊云科技内部,Amazon EC2 Trn2 实例将采用的正是 Trainium2,每个实例内置 16 个 Trainium 芯片。

这些 Trn2 实例的目的是为了支持客户在下一代 EC2 UltraCluster 中大规模扩展,最多可达 10 万个 Trainium2 芯片,通过亚马逊云科技弹性织物适配器(EFA)的 petabit 级网络连接,能够提供高达 65 exaflops 的强大计算能力。

有了这种规模,客户就可以在数周而不是数月时间内训练 3000 亿参数的大语言模型!

正如 Claude 背后公司 Anthropic 的联合创始人 Tom Brown 所述:

我们正在与亚马逊云科技密切合作,使用 Trainium 芯片开发我们未来的基础模型。

Trainium2 将帮助我们大规模构建和训练模型,我们预计它比第一代 Trainium 芯片快至少 4 倍,适用于我们的一些关键工作负载。

据悉,Trainium2 将从明年开始用于支持新的服务。

Amazon Q:亚马逊工作版 ChatGPT 出道

在生成式 AI 方面,亚马逊云科技还发布了自家工作版的 ChatGPT ——Amazon Q,重新构想了未来的工作方式。

Amazon Q 主要面向的是企业用户,它让员工可以利用公司的数据和专业知识获得答案、解决问题。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Amazon Q 基于亚马逊云科技 17 年的知识来训练,所以很懂亚马逊云科技,于是在使用亚马逊云科技过程中,可以随时随地提供帮助。

Adam 说,Amazon Q 改变了开发人员在亚马逊云科技上构建、部署和操作应用程序的方式。

它可以通过提出问题来了解亚马逊云科技功能和工作原理,或者确定最佳服务。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Amazon Q 不仅能介绍亚马逊云科技的各项功能,还可以根据用户需求,提供利用亚马逊云科技各项服务构建应用的方法。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在使用亚马逊云科技遇到问题和故障时,Amazon Q 也可以一键分析原因并想办法解决。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在亚马逊云科技控制台之外,Amazon Q 还可以在 IDE 中调用,实时帮助开发者生成或解释代码,并进行测试和优化。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

更为精彩的是,Amazon Q 可以完成从计划到代码,再到完成后的测试和用户文档的全流程自动开发

假如要给应用添加新功能,开发人员只需要用自然语言描述需求,然后检查 Amazon Q 给出的建议并进行必要调整就可以了。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

不过,开发不是一劳永逸,程序的维护和升级也至关重要。

而如果这之中涉及到了编程语言的更新迭代,开发者可能需要花费几个月甚至几年对代码进行逐行调整。

而 Amazon Q 的代码转换功能,将这一时间缩短到了几分钟。

开发人员只需在 IDE 中打开他们想要转换的代码,然后要求 Amazon Q 对其进行 "/transform" 即可。

最近,5 名开发人员用 Amazon Q 在短短两天内将 1000 个应用从 Java 8 升级到 Java 17,平均每个用时还不到 10 分钟。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

除了面向开发者的 Builder 版本, Amazon Q 还有为商业从业者提供的 Business 版本。

可以在亚马逊 QuickSight 数据分析平台和亚马逊云科技 Connect 中使用。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

将 Amazon Q 连接到企业系统,还能得到定制版的 Q,我们还可以看到 Amazon Q 帮助用户分析了下游客户的需求。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在此基础之上,Amazon Q 更是可以直接充当使用者的客服代表,解决下游用户提出的问题。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

做个总结的话,Business 版本的 Amazon Q 一共拥有四重 " 专家 " 身份:

亚马逊云科技专家,对亚马逊云科技的每一个功能、模块都有充分的了解。

生意专家,能够分析行业状况下游客户的需求。

商业智能专家,能够对大量商业数据进行分析。

客服专家,对用户企业情况充分了解,可以充当智能客服工作。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

价格方面,Business 和 Builder 版本的价格分别是每用户每月 20 美元和 25 美元。

还有其它发布

与这些芯片和聊天机器人 Amazon Q 同时发布的,还有全新的云存储服务亚马逊云科技 S3 Express One Zone。

它的速度是标准版 S3 的 10 倍,可以在 1 分钟之内处理数百万次请求,请求成本和计算成本分别降低了 50% 和 60%。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

工具层面,生成式 AI应用搭建平台 Bedrock也值得关注。

Adam 将其称作最简单的利用大模型搭建和扩展生成式 AI 的方式。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

此外还有和 Trainium 芯片配套的ML 优化 SDK  亚马逊云科技 Neuron。

排行前 100 的 ML 模型中,亚马逊云科技 Neuron 支持 93 种。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

按照基础设施层、工具层和应用层这三个层级进行划分,此次发布中涉及生成式 AI 的产品都在下面这张图里了:

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

One More Thing

据说这届亚马逊云科技的 re:Invent 活动吸引了来自全球的 5 万多人。

来,感受一下 Keynote 结束后的人山人海

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

最受喜欢

亚马逊云 英伟达 gpu 芯片 热点 本地 社区 美图 视频 直播 资讯 新闻

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13