NVIDIA 最新的 RTX PRO 6000 Blackwell 服务器版 GPU 即将在企业服务器中推出。

NVIDIA 最新资讯:Blackwell GPU 和软件更新
思科、戴尔科技、HPE、联想和超微的系统将在 2U 服务器中提供各种配置。Nvidia 表示,这些系统将为 AI、图形、模拟、分析和工业应用提供更高的性能和效率,并支持 AI 模型训练、内容创建和科学研究等任务。
NVIDIA 创始人兼首席执行官黄仁勋表示:“人工智能正在 60 年来首次重塑计算——最初源于云端的计算如今正在改变本地数据中心的架构。我们携手全球领先的服务器供应商,将 NVIDIA Blackwell RTX PRO 服务器打造为企业和工业 AI 的标准平台。”
业务工作负载的 GPU 加速
每年有数百万台服务器售出用于商业运营,其中大多数仍在使用“传统”CPU。该公司表示,全新的 RTX PRO 服务器为系统提供 GPU 加速,从而提升分析、模拟、视频处理和渲染的性能。NVIDIA 表示,其服务器版 GPU 的性能比纯 CPU 系统高出 45 倍,能效则高出 18 倍。
RTX PRO 系列面向那些在空间、电力和冷却系统方面可能受限的“AI 工厂”建设公司。这些服务器还为 NVIDIA 的 AI 数据平台(用于存储系统)提供基础设施。例如,戴尔正在更新其 AI 数据平台,以使用 NVIDIA 的设计;其 PowerEdge R7725 服务器配备两个 RTX PRO 6000 GPU、NVIDIA AI Enterprise 软件和 NVIDIA 网络。
这款新型 2U 服务器最多可容纳 8 个 GPU 单元,是 5 月份在 COMPUTEX 上发布的服务器之一。
布莱克韦尔建筑特色
新的服务器基于 NVIDIA 的 Blackwell 架构构建,其中包括:
第五代 Tensor Core 和具有 FP4 精度的第二代 Transformer Engine,推理速度比 L40S GPU 快六倍。
第四代 RTX 照片渲染技术,性能比 L40S GPU 提升高达四倍。
虚拟化和 NVIDIA 多实例 GPU 技术,允许每个 GPU 处理四个独立的工作负载。
提高能源效率,降低数据中心的电力消耗。
对于物理人工智能和机器人
RTX PRO 服务器上的 NVIDIA Omniverse 库和 Cosmos 世界基础模型可以运行数字孪生模拟、机器人训练例程以及大规模合成数据创建。它们还支持用于视频搜索和摘要的 NVIDIA Metropolis 蓝图、视觉语言模型以及其他用于物理环境的工具。
NVIDIA 已更新其 Omniverse 和 Cosmos 产品,新增 Omniverse SDK,并增加了与 MuJoCo (MJCF) 和 Universal Scene Description (OpenUSD) 的兼容性。该公司表示,这将使超过 25 万名 MJCF 开发者能够在其平台上运行机器人模拟。新的 Omniverse NuRec 库引入了光线追踪的 3D 高斯分布,可用于根据传感器数据构建模型。而更新的 Isaac Sim 5.0 和 Isaac Lab 2.2 框架(可在 GitHub 上获取)则为机器人和传感器添加了神经渲染和基于 OpenUSD 的新架构。
NuRec 渲染技术已集成到 CARLA 自动驾驶汽车模拟器中,并被 Foretellix 等公司采用,用于生成合成自动驾驶汽车测试数据。福特和保时捷等汽车制造商使用的 Voxel51 的 FiftyOne 数据引擎现已支持 NuRec。波士顿动力、Figure AI、Hexagon 和亚马逊设备与服务等公司已采用这些库和框架。
Cosmos WFM 的下载量已超过 200 万次。该软件可使用文本、图像或视频提示为机器人生成合成训练数据。全新的 Cosmos Transfer-2 模型可加快从模拟场景和深度图等空间输入生成图像数据的速度。Lightwheel、Moon Surgical 和 Skild AI 等公司正在使用 Cosmos,并已开始使用 Cosmos Transfer-2 大规模生成训练数据。
NVIDIA 还推出了 Cosmos Reason,这是一个拥有 70 亿个参数的视觉语言模型,旨在帮助机器人和 AI 代理将先验知识与物理理解相结合。它可以自动化数据集管理,支持多步骤机器人任务规划,并运行视频分析系统。NVIDIA 自己的机器人和 DRIVE 团队使用 Cosmos Reason 进行数据过滤和注释,Uber 和 Magna 也已将其部署到自动驾驶汽车、交通监控和工业检测系统中。
人工智能代理和大规模部署
RTX PRO 服务器可运行新发布的 Llama Nemotron Super 模型。在单块 RTX PRO 6000 GPU 上以 NVFP4 精度运行时,其性价比比 NVIDIA H100 GPU 上的 FP8 性能高出三倍。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...