gpu - 第2页 - 苏老的学习笔记

nvidia-peermem和dmabuf两种GDR方式的区别

NCCL 的源码中，具有两种方式的 GDR，nvidia-peermem和dmabuf，在注册收发缓冲区时会优先选择后面一种方式。源码注释中的nv_peermem和nvidia-peermem是同一个东西，在不同版本的叫...

荐 ubuntu22.04使用nccl-tests进行单机多卡通信测试

我们之前安装过nccl，只不过都是通过yum或者apt安装，我们这次使用离线编译安装的方式再次进行nccl的安装，使用编译安装可以自定义nccl的安装目录，然后使用的时候我们需要设置下LD_LIBRARY_PATH目录即...

linux下使用cublasMatmulBench对GPU进行测试

cublasMatmulBench这个工具非官方渠道的工具，但是从nvidia github上的资料信息来看，应该是某些渠道获取的一个工具，可以在环境中正常使用。今天就来介绍怎么使用这个工具，用法比较简单，主要是针对GM...

tensorflow模型占用大量GPU显存的处理方法

Tensorflow在启动的时候会占用所有显存，然后自行对显存进行管理，这是tensorflow的显存管理机制，他可以申请到连续的显存地址然后进行分配，这样对显存的使用更高效，在实际使用中，由于显存资源比较紧张，所以可以...

GPU性能分析工具nsys(Nsight Systems)安装和简单使用

NVIDIA Nsight™ Systems 是一款系统级性能分析工具，旨在实现应用算法的可视化，找出程序中最值得优化的"瓶颈"，并进行调整以跨任意数量或大小的 CPU 和 GPU (从大型服务器到最小的系统级芯片 (S...

GPU锁频的方法以及pytorch验证测试代码

gpu在电源功率不足，温度过高或者在长期高负载或者是驱动程序影响的情况下会降频，那么我们可以通过锁频来固定gpu的频率，当然这种方式也不能解决高温和电源功率不足的问题，我们这里只是了解下如何锁频，操作比较简单。我们首先通...

gpu
pytorch

荐 GPU计算能力、驱动、CUDA、架构兼容支持矩阵

CUDA驱动程序提供向后兼容的API。因此，新的NVIDIA驱动程序将始终与旧的CUDA工具包一起工作。这里记录了CUDA的这种行为。然而，每个CUDA工具包都需要最低版本的NVIDIA驱动程序。因此，当使用诸如NVID...

gpu
cuda

荐 GPU计算能力(Compute Capability)对照表

计算能力（CC）定义了每个NVIDIA GPU架构的硬件特性和支持的指令。在下表中查找您的GPU的计算能力。对于传统GPU，请参考传统CUDA GPU计算能力。有些卡没有找到，但是你可以通过命令查询卡的计算力，使用如下命...

荐 ubuntu22.04使用gpu-burn进行gpu显卡测试

gpu-burn是一款GPU压力测试工具，今天就来介绍下如何安装和使用gpu-burn。首先我们我先去拉取源码包，地址是：https://github.com/wilicc/gpu-burn，目前也支持部分操作系统的二进...

荐评估AI模型需要gpu显存资源

我们通常看到发布的开源模型都会有写10b,17b,100b等等这些数字，这些都是指的模型参数规模，现在大模型参数从原来的亿级暴增至几百亿，这些由于现在gpu性能的大幅提升以及应用对模型的性能需求，导致了参数规模爆发式增长...

ai
gpu

荐 k8s集群中英伟达gpu多实例mig资源上报和分配方法

多实例GPU（MIG）功能允许将GPU安全地划分为多个独立的GPU实例，供CUDA应用程序使用。英伟达高端GPU卡都可以开启MIG，一般MIG实例最多可分配7个。MIG主要针对于那些未充分利用GPU资源的用户提供的GPU...

ubuntu22.04安装nvidia-container-runtime

之前也有在centos7和ubuntu20.04安装过nvidia-container-runtime，这次是在ubuntu22.04上进行安装，nvidia-container-runtime的作用就是在docker环...

荐 python获取k8s中使用物理卡pod列表脚本

在维护算力集群的时候有时候需要统计集群环境中使用GPU卡的POD列表，那么我们经常使用的话这里写了一个脚本方便查询和罗列出这些POD，脚本中主要使用subprocess模块来获取kubectl命令返回的结果，所以执行脚本...

荐 nccl-tests工具安装和使用openmpi配合测试多机多卡性能

NCCL Tests是一个开源的测试套件，由NVIDIA开发并维护，目的是为了帮助开发者更好地理解和利用NCCL的功能。它提供了多种并发和消息传递模式的基准测试，以评估多GPU间的通信效率，并且支持各种CUDA和MPI环...

英伟达GPU异常问题常见处理方法

日常在一些程序中进行GPU调用，这些cuda程序异常崩溃的时候，有时会遇到掉卡掉驱动、没有进程但是显存被占用的情况，这个时候我们可以通过以下命令来尝试进行处理。如果是掉卡的话可以使用lspci查看下主板上还能否检测到GP...

nvidia
gpu

今日天气

分类统计

博文归档

2篇

1篇

2篇

8篇

6篇

6篇

3篇

12篇

15篇

43篇

23篇

9篇

热门推荐

热门标签

nvidia-peermem和dmabuf两种GDR方式的区别

荐 ubuntu22.04使用nccl-tests进行单机多卡通信测试

linux下使用cublasMatmulBench对GPU进行测试

tensorflow模型占用大量GPU显存的处理方法

GPU性能分析工具nsys(Nsight Systems)安装和简单使用

GPU锁频的方法以及pytorch验证测试代码

荐 GPU计算能力、驱动、CUDA、架构兼容支持矩阵

荐 GPU计算能力(Compute Capability)对照表

荐 ubuntu22.04使用gpu-burn进行gpu显卡测试

荐评估AI模型需要gpu显存资源

荐 k8s集群中英伟达gpu多实例mig资源上报和分配方法

ubuntu22.04安装nvidia-container-runtime

荐 python获取k8s中使用物理卡pod列表脚本

荐 nccl-tests工具安装和使用openmpi配合测试多机多卡性能

英伟达GPU异常问题常见处理方法

荐英伟达GPU配置MIG实例和原理介绍

Nvidia Device PLugin工作原理机制

目前主流几种GPU共享技术原理

GPU虚拟化MIG和vGPU技术对比

k8s使用k8s-device-plugin组件将GPU信息注入到POD并挂载

常用网站

今日天气

分类统计

博文归档

2篇

1篇

2篇

8篇

6篇

6篇

3篇

12篇

15篇

43篇

23篇

9篇

热门推荐

热门标签

荐 ubuntu22.04使用nccl-tests进行单机多卡通信测试

荐 GPU计算能力、驱动、CUDA、架构兼容支持矩阵

荐 GPU计算能力(Compute Capability)对照表

荐 ubuntu22.04使用gpu-burn进行gpu显卡测试

荐 评估AI模型需要gpu显存资源

荐 k8s集群中英伟达gpu多实例mig资源上报和分配方法

荐 python获取k8s中使用物理卡pod列表脚本

荐 nccl-tests工具安装和使用openmpi配合测试多机多卡性能

荐 英伟达GPU配置MIG实例和原理介绍

常用网站

荐评估AI模型需要gpu显存资源

荐英伟达GPU配置MIG实例和原理介绍