国产化服务器透传NVIDIA TESLA T4卡
国产化服务器
最近玩了玩GPU卡在鲲鹏920处理器上的透传测试,记录一下测试的结果。
测试准备
拿到服务器配上带外,看一下服务器的型号,验证是真的国产化不是x86
既然都拿到了国产化服务器了,不如操作系统也用国产化的银河麒麟v10 SP1: 银河麒麟官方网站,想了解国产化操作系统可以看看.来搞吧????使用lscpu看一下我们的Model确实是kunpeng-920。
鲲鹏920处理器,基于7nm工艺、ARM架构,最多64个核心,最高频率2.6GHz,并支持PCIe 4.0、八通道DDR4内存,号称同类产品业界性能最高,有待求证!
开始测试
服务器操作系统,网络配置好之后,接下来就是把我们的NVIDIA TESLA T4的卡插进服务器中的盖上机箱,使用lspci命令看到能识别到这个GPU卡,但是使用nvidia-smi命令却查不到GPU卡的信息
经过一番查询,发现华为官方的说法,觉得可能驱动程序没有安装,所以导致NVIDIA-SMI与NVIDIA无法通信
所以去NVIDIA的官网下载驱动程序
因为kylin v10 SP1是基于CentOS 8做的所以这里我们选择Linux aarch64-bit RHEL8,一定要是aarch的,因为是ARM架构的,不能用x86的包
选择特定的版本进入下载页面,单击【DOWNLOAD】。如下图所示:
如有填写个人信息的页面可选择直接跳过,当出现以下页面时,右键单击【AGREE&DOWNLOAD】并选择菜单中的【复制链接地址】。如下图所示:
然后进入到服务器使用wget命令下载
或者可以在本地系统下载 NVIDIA 安装包,再上传到 GPU 实例的服务器。
安装驱动可能会遇到警告,不用管直接跳过,遇到报错的话需要中止安装,排完错在安装
大致会遇到的几种报错:
驱动安装成功之后,使用nvidia-smi查看GPU卡的信息
折腾半天,终于搞好了。那如果安装了CUDA,就可以使用这张显卡做一些事情了,比如深度学习等等,这篇博客就不再深入记录了,放一张安装CUDA之后的成功显示。感兴趣的话有时间再倒腾
本文地址:https://blog.csdn.net/Tong89_xi/article/details/110522873