为开发人员推出新的NVIDIA加速计算库更新
NVIDIA加速计算库NVIDIA本周宣布更新其加速计算库,为开发人员提供65个软件开发套件,用于加速量子计算、最后一英里交付、PyData生态系统的超级计算以及更多增强的150多种产品目录。NVIDIAReOpt、cuQuantum、cuNumeric、cuGraph、Modulus、Morpheus、NeMoMegatron、Riva、RAPIDS、DOCA等的更新。
NVIDIA发布的新SDK包括:
用于实时物流的NVIDIAReOpt引入了先进的大规模并行算法,可优化车辆路线、仓库选择和车队组合。其动态重新路由功能可以减少旅行时间、节省燃料成本并最大限度地减少闲置时间,可能为物流和供应链行业节省数十亿美元。
cuNumeric用于数组计算,它实现了NumPy应用程序编程接口,以零代码更改自动扩展到多GPU和多节点系统——这是使用Python的2000万强大的数据科学家、研究人员和科学家社区的价值。它现已在GitHub和Conda上提供,可扩展到数千个GPU,为PyData和NumPy生态系统创建加速计算。
用于量子计算的cuQuantum使大型量子电路的模拟速度显着加快,从而使量子研究人员能够研究更广阔的算法和应用空间。开发人员可以模拟诸如分子的近期变分量子算法和纠错算法等领域,以识别容错,并加速来自Atos、谷歌和IBM的流行量子模拟器。
CUDA-X加速DGL容器,用于图神经网络,为使用大型图的GNN工作的开发人员和数据科学家提供了一种快速设置工作环境的方法。该容器可以轻松地在结合DGL和Pytorch的集成、GPU加速的GNN环境中工作。使用GPU加速的GNN,即使是世界上最大的图,在单个图中接近1万亿条边,也可以被挖掘以获取洞察力。例如,Pinterest使用具有数十亿个节点和边的图神经网络来了解其超过3000亿个Pin的生态系统,基于GPU和用于模型训练和推理的优化库。
更新的NVIDIASDK
用于数据科学的RAPIDS21.10提供了处理时间序列数据的新函数以及对现有算法的若干加速。适用于ApacheSpark3.0的RAPIDSAccelerator允许企业在不更改代码的情况下加速其在NVIDIAGPU上的分析操作。今年RAPIDS的下载量增长了400%,这是NVIDIA最受欢迎的SDK之一。
用于智能视频分析的Deepstream6.0引入了一个新的图形编辑器界面,使用户能够以最少的编码能力和可视化拖放界面访问计算机视觉,以实现简单、直观的AI产品开发流程。
Triton2.15、TensorRT8.2和cuDNN8.4,用于深度神经网络,为大型语言模型和梯度提升决策树和随机森林的推理加速提供了新的优化。
DOCA1.2用于数据中心网络,提供零信任安全框架,通过硬件和软件身份验证、线速数据加密、分布式防火墙和智能遥测扩展威胁防护。
用于推荐系统的Merlin0.8具有新功能,可以在很少或没有用户数据的情况下预测用户的下一步动作,并支持大于GPU内存的模型。