导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

NVIDIA GQE 为 GPU 加速查询引擎设定基准

NVIDIA 的 GPU 查询引擎 (GQE) 利用 Grace Blackwell 硬件提供比 CPU 快 7.5 倍的数据库性能。了解具体操作方法。

NVIDIA GQE Sets Benchmark for GPU-Accelerated Query Engines

NVIDIA 推出了用于 GPU 加速数据库查询处理的尖端参考架构,称为 GPU 查询引擎 (GQE)。据报道,GQE 旨在最大限度地发挥 NVIDIA Grace Blackwell 硬件的功能,在关键基准测试中的速度比传统 CPU 数据库引擎提高了 7.5 倍,使其成为高性能分析领域的领导者。

GQE 利用 NVIDIA 的先进硬件功能,包括高带宽内存 (HBM)、NVLink-C2C 互连和专用解压缩引擎,以解决内存和 I/O 限制等长期存在的瓶颈。通过加速 CPU 和 GPU 之间的数据移动并优化查询执行,GQE 显着提高了大规模分析工作负载的吞吐量。

分解 GQE 架构

GQE 通过三个协调层进行操作:查询、数据和执行。查询层与开源查询计划格式 Substrait 集成,以简化现有数据库系统的转换。数据层有效地组织数据并将其从CPU传输到GPU,而执行层则使用NVIDIA的cuDF和其他CUDA-X库来实现高性能查询执行。

一个突出的功能是 GQE 执行分区修剪的能力,它可以在传输之前跳过不相关的数据。在使用行业标准 TPC-H 基准测试 1 TB 规模的测试中,分区修剪将数据移动减少了 31%,总体速度提高了 1.43 倍。

压缩技术推动性能提升

压缩是 GQE 设计的另一个基石。通过 NVIDIA nvCOMP 库使用 GPU 优化格式,GQE 减少了内存占用并加速了数据传输。 NVIDIA Blackwell 解压缩引擎发挥着关键作用,无需使用 GPU 核心即可实现高达 400 GB/s 的解压缩速度,进一步提高吞吐量。

该架构采用混合压缩策略,将用于结构化数据的 Cascaded 等轻量级算法与用于通用数据的 LZ4 相结合。这种双重方法使 GQE 能够平衡压缩比和传输带宽,从而优化不同工作负载的性能。

性能亮点

NVIDIA 在 TPC-H 基准测试中展示了 GQE 的功能,在 22 个查询中,有 20 个查询的性能优于基于 CPU 的领先数据库引擎 DuckDB。在单个 GB200 GPU 上运行时,GQE 只需 9 秒即可完成完整基准测试,而 DuckDB 在双路 AMD CPU 设置上需要 74 秒。单个查询加速范围从接近同等到超过 25 倍,总体性能显示出 7.5 倍的改进。

对数据分析市场的影响

GPU 加速查询引擎正在吸引那些希望更快、更高效地处理海量数据集的企业。最近的合作,例如 NVIDIA 与 Starburst 和 AWS 的集成(2026 年 6 月),凸显了围绕基于 GPU 的分析不断发展的生态系统。 IBM 等竞争对手也通过 GPU 加速查询解决方案的私有技术预览进入该领域。

对于分析密集型行业,GQE 和类似系统提供了令人信服的价值主张:更高的吞吐量、更低的基础设施成本以及与 AI 工作负载的无缝集成。 NVIDIA 对 Substrait 和 RAPIDS cuDF 等开放架构的关注进一步降低了采用门槛,使更广泛的组织能够使用 GPU 加速。

下一步是什么?

随着 GQE 的开源设计的推出,它为数据库开发人员利用 GPU 的能力提供了蓝图。随着性能提升 7.5 倍,企业明显有动力重新考虑其数据平台,特别是当 GPU 驱动的技术扩展到人工智能原生工作负载和矢量搜索应用程序时。

展望未来,NVIDIA 持续的硬件创新和生态系统合作伙伴关系可以巩固 GPU 加速查询引擎作为大规模分析的新标准。

书签