AIGC | 在机器学习工作站安装NVIDIA CUDA® 并行计算平台和编程模型
总体而言,CUDA 已经成为科学计算和各种数据密集型应用的重要工具之一,通过利用 GPU 的并行计算能力,显著提高了计算速度和效率。
GTC 2024 | 使用NVIDIA GPU和VMAF-CUDA计算视频质量
传统的视频质量评价指标包括 PSNR 和 SSIM 等。而 VMAF 由 Netflix于 2017 年提出,是一种全参考的视频质量评价指标,分数范围由 0 到 100,越高代表质量越好。VMAF 试图准确地捕捉人类的感知,将人类视觉建模与不断发展的机器学习技术相结合,使其能够适应新的内容,在与人类视觉感知保持一致方面表现出色。VMAF 现在已经被 Netflix,Snap,V-Nova等公司采用。
CUDA与OpenCL:并行计算革命的冲突与未来
本文翻译自:《CUDA vs OpenCL vs Metal : The Battle for GPU Acceleration Supremacy》
【BBuf的CUDA笔记】十二,LayerNorm/RMSNorm的重计算实现
我也是偶然在知乎的一个问题下看到这个问题,大概就是说在使用apex的LayerNorm/RMSNorm的时候可以打开这个api的memory_efficient开关,这个开关可以在速度和精度无损的情况下节省网络训练的显存占用。感觉比较有趣,我就研究了一下,因此也就有了这篇文章。
利用基于NVIDIA CUDA的点云库(PCL)加速激光雷达点云技术
在这篇文章将介绍如何使用CUDA-PCL处理点云来获得最佳性能,由于PCL无法充分利用Jetson上的CUDA,NVIDIA开发了一些具有与PCL相同功能的基于CUDA的库。代码地址:https://github.com/NVIDIA-AI-IOT/cuPCL.git(只有动态库和头文件,作者说源码将在未来开源)。
【已解决】Python报错 RuntimeError: No CUDA GPUs are available
在使用深度学习框架,如PyTorch或TensorFlow时,我们经常希望利用CUDA加速计算。然而,有时可能会遇到一个错误:RuntimeError: No CUDA GPUs are available。
这个错误表明深度学习框架无法检测到可用的CUDA GPU。但是大家明明都安装了CUDA了。
那么本文将详细分析这个错误的原因,并提供相应的解决方案。
【RTX 3060Ti 深度学习环境配置图文(安装Anaconda、VScode、CUDA、CUDNN、pytorch)】
作者配置为台式3060ti,环境为cuda11.4,cudnn8.2,pytorch1.9,python3.9
如何在 Windows 系统上使用 CUDA 运行 Mozilla TTS/Coqui TTS 培训?
我有一台带有 Quadro P5000 显卡的机器,运行 Windows 10。我想在这个系统上训练 TTS 语音。我需要安装什么才能使它正常工作?