UCX是Unified Communication X的简称,主要提供RDMA通信的高级API以加速应用开发,在隐藏底层细节的同时还实现了一些优化和最佳实践以保持高性能和可扩展。OpenMPI是一个开源的消息传递接口(M...
Conda是一个强大的命令行工具,用于包和环境管理,可在Windows、macOS 和 Linux 上运行,Miniconda和Conda的区别是Miniconda是Anaconda的简化版,它默认只包含Python和C...
OSU Micro benchmark工具是由Ohio State University提供的MPI(Message Passing Interface,消息传递接口)通信效率评测工具。该工具旨在通过执行不同模式的MPI...
cublasMatmulBench这个工具非官方渠道的工具,但是从nvidia github上的资料信息来看,应该是某些渠道获取的一个工具,可以在环境中正常使用。今天就来介绍怎么使用这个工具,用法比较简单,主要是针对GM...
一般公司都会有提供Vpn来对公司内网来连接内网程序和网络来进行办公,这个提供了安全稳定专业的网络隧道来保证办公内网网络的安全。一般使用的openvpn方案,所以在ubuntu上也是可以安装配置客户端的,并且比window...
Tensorflow在启动的时候会占用所有显存,然后自行对显存进行管理,这是tensorflow的显存管理机制,他可以申请到连续的显存地址然后进行分配,这样对显存的使用更高效,在实际使用中,由于显存资源比较紧张,所以可以...
NVIDIA Nsight™ Systems 是一款系统级性能分析工具,旨在实现应用算法的可视化,找出程序中最值得优化的"瓶颈",并进行调整以跨任意数量或大小的 CPU 和 GPU (从大型服务器到最小的系统级芯片 (S...