导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

NVIDIA 使用 Nsight 工具优化 Omniverse NuRec 管道

NVIDIA 利用 Nsight Systems 和 Compute 将其神经重建管道优化 50 倍,增强人工智能和机器人模拟。

NVIDIA Optimizes Omniverse NuRec Pipeline with Nsight Tools

NVIDIA 公布了其 Omniverse NuRec 神经重建管道的显着性能改进,这是一项利用多传感器数据创建真实世界环境高保真模拟的关键技术。借助 Nsight 开发者工具,NVIDIA 将核心处理任务的速度提高了近 50 倍,这一突破增强了 NuRec 在自动驾驶车辆 (AV)、机器人和 AI 训练工作流程中的可用性。

NuRec 集成了 3D 高斯 Splatting 等先进的神经渲染技术,可将来自摄像头和激光雷达的传感器数据转换为逼真的 3D 环境。这些环境对于训练和验证物理 AI 系统至关重要,使工程师能够重播动态场景、验证模型行为并生成合成训练数据。然而,到目前为止,这种保真度的计算需求一直是一个瓶颈。

Nsight 开发者工具的主要见解

NVIDIA 的优化过程首先使用 Nsight Systems 进行性能分析,该工具可以可视化跨 CPU、GPU 和其他资源的工作负载行为。初步分析显示 GPU 利用率低下,尤其是插值函数,该函数因大量小型 CUDA 内核而陷入困境。通过将这些操作融合到单个内核中,NVIDIA 将处理时间从 4.184 毫秒减少到仅 83.81 微秒,提高了 50 倍。

进一步的改进解决了同步延迟和工作负载不平衡的问题,使 GPU 能够更紧凑地处理任务。然后,使用另一个分析工具 Nsight Compute 来分析特定内核的性能,例如处理激光雷达和相机数据的 renderBackward。 NVIDIA 针对每种数据类型将内核拆分为单独的版本,微调资源分配,将 GPU 占用率从 15% 提高到高达 50%。最苛刻内核的运行时间从 31 毫秒降至 18 毫秒。

对人工智能和机器人技术的影响

这些优化具有深远的影响。 NuRec 是 NVIDIA Omniverse 平台的基石,该平台服务于从自动驾驶汽车到数字孪生等行业。更快的重建时间直接提高了工程生产力,实现了实时场景处理。这对于依靠快速迭代来完善感知模型和规划算法的 AV 和机器人开发人员来说至关重要。

除了重建之外,NuRec 的增强性能还可以扩展到要求苛刻的任务,例如生成用于强化学习的合成数据和进行大规模模拟。减少这些工作流程的 GPU 时间不仅可以降低基础设施成本,还可以加速物理 AI 系统的更广泛开发。 NVIDIA 的 Omniverse 路线图包括雄心勃勃的 Cosmos 世界模型和 DSX 数据中心,将 NuRec 定位为下一代人工智能系统的关键技术。

战略背景

NVIDIA 在 NuRec 方面取得的进步是在更广泛地推动人工智能和模拟领域占据主导地位的背景下取得的。今年早些时候,NVIDIA 与 Microsoft 合作,利用 Omniverse 进行核基础设施项目,展示了该平台超越传统机器人和 AV 应用的潜力。与 AI 数据中心的 Omniverse DSX 蓝图等创新相结合,NuRec 巩固了 NVIDIA 在将现实世界数据转化为可操作、可模拟的环境方面的领导地位。

虽然 NuRec 本身不是可交易资产,但它在 NVIDIA 生态系统中的作用使其成为公司增长的战略驱动力。随着人工智能采用的加速,NuRec 和 Nsight 开发工具等工具对于投资模拟技术的行业至关重要。

开发人员和工程师可以直接通过 NVIDIA 网站探索这些工具,Nsight Systems 和 Nsight Compute 均可免费下载。 NuRec 的持续优化强调了性能调整的迭代性质以及 NVIDIA 致力于突破 GPU 加速模拟极限的承诺。

书签