英伟达深夜再放炸弹,发布超级芯片GH200反击AMD
新平台和芯片的加持,也让大模型训练的成本得到有效降低。
【资料图】
洛杉矶当地时间8月8日,在计算机图形学顶会SIGGRAPH 2023现场,英伟达再度释放深夜“炸弹”,大模型专用芯片迎来升级版本。
英伟达在会上发布了新一代GH200 Grace Hopper平台,该平台专为处理大语言模型、推荐系统、矢量数据库等全球最复杂的生成式 AI 工作负载而构建。
来源:英伟达
GH200 Grace Hopper平台依托于搭载全球首款搭载HBM3e处理器的新型Grace Hopper超级芯片——GH200。HBM3e 内存比当前 HBM3 快 50%,可提供总计 10TB/s 的带宽。这使得新平台能够运行比上一版本大 3.5 倍的模型,同时凭借快 3 倍的内存带宽提升性能。
据介绍,该平台采用双配置,提供的内存容量和带宽比当前产品分别增加了 3.5 倍和 3 倍,包括一个拥有 144 个 Arm Neoverse 内核、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 内存技术的单个服务器。
英伟达创始人兼首席执行官黄仁勋表示:“为了满足对生成式 AI 不断激增的需求,数据中心需要能够满足特定需求的加速计算平台。全新GH200 Grace Hopper 超级芯片平台以出色的内存技术和带宽,提高了吞吐量,在不影响性能的情况下可连接多 GPU 以整合性能,并且具有可以轻松部署到整个数据中心的服务器设计。”
据英伟达公布信息,新平台可以通过 NVIDIA NVLink™ 与其他超级芯片连接,使它们能够协同工作,从而部署当下大型生成式 AI 模型。这种高速、一致性技术使 GPU 可以完全访问 CPU 内存,在双配置中可提供总计 1.2TB 的快速内存。
值得注意的是,新平台采用的新款超级芯片GH200与此前发布的H100相比,二者使用同样的GPU,但GH200将同时配备高达141G的内存和72核ARM中央处理器,每秒5TB带宽,内存增加了1.7倍,带宽增加了1.5倍。
英伟达称,GH200已于 5 月全面投产,基于GH200 Grace Hopper平台的新系统将于2024年第二季度交付。
新平台和芯片的加持,也让大模型训练的成本得到有效降低。黄仁勋表示,一台服务器可以同时装载两个GH200超级芯片,大型语言模型的推理成本将会大幅降低。据介绍,投资800万美元Grace Hopper,就相当于8800个价值1亿美元的x86 GPU,意味着成本降低12倍,能耗降低20倍。
为降低了启动企业 AI 项目的复杂性,英伟达当日还发布了英伟达AI Workbench。其能够为开发者提供一个统一、易用的工作空间,使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将这些模型扩展到几乎所有数据中心、公有云或DGX Cloud。
来源:英伟达
AI Workbench通过一个在本地系统上运行的简化界面访问,开发者可以使用自定义数据对来自 Hugging Face、GitHub 和 NVIDIA NGC™ 等流行资源库的模型进行定制。然后,这些模型可以多个平台之间轻松共享。
英伟达企业计算副总裁 Manuvir Das 表示:“全球各地的企业都在竞相寻找合适的基础设施并构建生成式 AI 模型和应用。NVIDIA AI Workbench 为跨组织团队创建基于 AI 的应用提供了一条简化的途径,而这些应用正日益成为现代商业的关键。”
此外,英伟达与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮助他们构建大语言模型(LLM)和其他高级 AI 应用。此次合作将使开发者能够使用 Hugging Face 平台内的 NVIDIA DGX™ Cloud AI 超级计算为高级 AI 模型进行训练及调优,借助为智能聊天机器人、搜索、摘要等特定行业应用的业务数据定制的大语言模型(LLM),推动生成式 AI 在各个行业中的应用。
黄仁勋表示:“Hugging Face 与 英伟达正在将全球最大的 AI 社区与英伟达在全球领先云环境中的AI计算平台相连接。通过双方的合作,Hugging Face 社区用户只需要点击一下鼠标,就可以使用 NVIDIA AI 计算。”
作为合作的一部分,Hugging Face 将提供一项名为“训练集群即服务”的新服务,用以简化企业创建新的自定义生成式 AI 模型的过程。该服务由 NVIDIA DGX Cloud 提供支持,将在未来几个月内推出。
为可扩展的开放式3D世界生态系统通用场景描述提供加速,英伟达在会上还发布了3款适用于台式工作站的GPU:RTX 5000、RTX 4500和RTX 4000。这些工作站级别的 GPU 采用第三代RT Core,其吞吐量高达上一代的2倍。这使得用户能够实时处理更大且保真度更高的图像。
英伟达针对企业客户,还为去年发布的RTX 6000推出了最新的一站式解决方案RTX工作站。新的RTX工作站由英伟达和BOXX、戴尔科技、惠普和联想合作推出,支持最多4张RTX 6000 GPU,可以在15小时内完成8.6亿token的GPT3-40B的微调。
在价格方面,RTX 5000 售价 4000 美元;RTX 4500 售价 2250 美元;RTX 4000 售价 1250 美元。目前,RTX 5000 已经在 Leadtek、PNY 和 Ryoyo Electro 等合作伙伴处上市销售,而其他两款 GPU 以及搭载最多四块 RTX 6000 GPU 的 NVIDIA RTX 工作站系统将在今年秋季推出。
英伟达此次深夜放大招,也被视为对竞争对手AMD的反击,此前英伟达曾预告将发布与AMD的大模型专用芯片Insight MI300X CPU + GPU竞争的产品。
黄仁勋在演讲中称,“生成式 AI 时代和 AI 的 iPhone 时刻已经到来”。对于英伟达来说,此次发布的GH200芯片及相应平台,以及AI Workbench、工作站用GPU等,都将成为AIGC时代英伟达商业拓展之路前进的一步。
关键词:
相关阅读
-
英伟达深夜再放炸弹,发布超级芯片GH200...
新平台和芯片的加持,也让大模型训练的成本得到有效降低。洛杉矶当地时 -
住总5.2亿底价摘得延庆南辛堡村地块
北京商报讯(记者王寅浩)8月9日,据北京市规自委网站消息,北京住总房地 -
小米MIX Fold 3外观正式公布 后置徕...
【手机中国新闻】8月8日下午,手机中国注意到,小米手机官方正式公布了 -
惠州车主请注意!今晚,油价将迎“四连涨”
8月9日24时,成品油价将迎来新一轮调整窗口期,根据目前原油变化率等因 -
女子网购被花呗扣款纠纷
8月9日消息,日前,一则“女子2百多网购却被花呗扣款3千多”的引起... -
大象夜读|张兰大S发律师函“互杀”!把...
8月8日,全民健身日,张兰和前儿媳大S在网上用律师函“你来我往”又... -
婴儿毛细血管瘤是这些症状,家长可别错...
毛细血管瘤是一种常发生于婴儿的疾病,发病时通常会表现出异常的红点, -
街头“口袋公园”,满载市民“小幸福”
视频加载中 江南都市报讯 全媒体记者刘健摄影报道:8月7日清晨,在 -
平安证券:资本市场的重要性仍将增加 ...
平安证券指出,近期政策利好不断落地。此次结算备付金比例调降是对活跃 -
互联网行业2023年8月投资策略:港股互联...
互联网行业2023年8月投资策略:港股互联网有望继续反弹推荐确定性较高 -
企业安全生产许可证在哪个部门办理(安...
来为大家解答以上的问题。企业安全生产许可证在哪个部门办理,安全生产 -
一图全知道:A股定价状态与预期变化8月第1期
一图全知道:A股定价状态与预期变化8月第1期 -
环境问题归根到底就是()问题 A 产业结...
来为大家解答以上的问题。环境问题归根到底就是()问题A产业结构,环境 -
微波炉烤东西和烤箱烤有什么区别(微波...
相信大家对微波炉烤东西和烤箱烤有什么区别,微波炉热不了东西是什么原 -
黑龙江再发暴雨红警 牡丹江洪水形成 ...
黑龙江再发暴雨红警牡丹江洪水形成务必加强防范注意避险 -
美国首都华盛顿发生多起枪击事件致6人死亡
新华社华盛顿8月6日电美国首都华盛顿5日发生数起枪击事件,造成至少6人 -
高通全球高级副总裁钱堃:5G+AI创造智能...
8月9日,由无锡市人民政府、江苏省工业和信息化厅主办,无锡市工业和信 -
三星医疗:子公司预中标1.78亿元南方电...
三星医疗(601567)8月4日晚间公告,公司下属子公司宁波奥克斯智能科技股 -
美互联网行业组织提交法庭文书反对蒙大...
新华社洛杉矶8月8日电(记者黄恒)美国两家与互联网相关的行业组织7日 -
郑州楼市新政24小时:二手房源挂牌量激...
“郑州楼市新政15条”落地后,郑州二手房市场挂牌量有所增加,业主...