使用NVIDIA CUDA-X增强基于云的数据科学并盘绕

使用NVIDIA CUDA-X增强基于云的数据科学,并盘绕

ted hisokawa 5月16日,2025年5月16日,2025年5月16日

NVIDIA CUDA-X与云平台的整合正在通过显着提高计算效率并简化基础架构管理来改变数据科学的景观。这种开发对于处理大型数据集的数据科学家特别有益,例如纽约市乘车共享JO的数据集根据Nvidia的博客文章。通过利用cudf.pandas加速器,数据科学家可以立即在GPU上执行大熊猫操作,从而提高了150倍的速度。这种效率对于分析广泛的数据集至关重要,例如NYC出租车和豪华轿车委员会(TLC)Trip Record数据,其中包含数百万个乘车详细信息。

云GPU可访问性

云平台可立即访问最新的NVIDIA GPU Architectures,可允许基于团队的最新资源来缩放计算资源。这使人们可以访问高级GPU加速,从而实现更快的数据处理和更深入的分析见解。例如,现在可以使用GPU在几秒钟内完成花费CPU的任务,从而可以进行更多的迭代和探索性分析。

用盘绕的基础架构

盘绕,通过抽象云配置的复杂性来简化GPU加速数据科学的部署。通过使用盘绕,数据科学家可以专注于分析而不是基础架构管理,从而加速创新。 Coiled facilitates the use of Jupyter notebooks and Python scripts on cloud GPUs, ensuring a seamless transition from local development to cloud execution.

Case Study: NYC Ride-Share Dataset

The NYC TLC Trip Record Data, accessible through S3, provides a practical example of the power of GPU acceleration.现在可以迅速执行以前需要大量计算资源的操作。例如,与传统的pandas相比,CUDF.PANDAS的加载和优化数据类型,根据公司计算收入和利润以及基于持续时间的旅行都显着加速。

绩效指标

实际上是GPU-ACCELERATED与CPU实施相比,数据处理操作的版本达到了8.9倍加速。 Even when considering the time for infrastructure setup, the overall performance improvement remains substantial, highlighting the benefits of integrating NVIDIA RAPIDS with Coiled.

Conclusion

The combination of NVIDIA CUDA-X and Coiled offers a powerful toolkit for data scientists, enabling them to accelerate analytical workflows and reduce development cycles without getting bogged down by infrastructure 管理。这种方法可确保数据科学家可以专注于从数据中获得见解,而不是管理计算资源。

有关更多详细信息,可以在Nvidia Blog上访问原始文章。

图像来源:ShutterStock。
Previous PostStablecoins:转变全球付款和货币的未来
Next Post没有了