欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

国产化服务器透传NVIDIA TESLA T4卡

程序员文章站 2022-03-01 16:30:14
国产化服务器随着华为事件的发生,中国企业面临操作系统或遭禁令扼喉的威胁,国家层面终于意识到了,国产化生态圈的重要性,最近几年国产化服务器冒出的来的越来越多,但是大多都是围绕着芯片来搞,像搭载着飞腾、鲲鹏芯片的ARM服务器有浪潮,曙光,华为等等,那么ARM的服务器能不能支持GPU的透传呢?最近玩了玩GPU卡在鲲鹏920处理器上的透传测试,记录一下测试的结果。测试准备拿到服务器配上带外,看一下服务器的型号,验证是真的国产化不是x86既然都拿到了国产化服务器了,不如操作系统也用国产化的银河麒麟v10 S...

国产化服务器

最近玩了玩GPU卡在鲲鹏920处理器上的透传测试,记录一下测试的结果。

测试准备

拿到服务器配上带外,看一下服务器的型号,验证是真的国产化不是x86
国产化服务器透传NVIDIA TESLA  T4卡
既然都拿到了国产化服务器了,不如操作系统也用国产化的银河麒麟v10 SP1: 银河麒麟官方网站,想了解国产化操作系统可以看看.来搞吧????使用lscpu看一下我们的Model确实是kunpeng-920。
鲲鹏920处理器,基于7nm工艺、ARM架构,最多64个核心,最高频率2.6GHz,并支持PCIe 4.0、八通道DDR4内存,号称同类产品业界性能最高,有待求证!
国产化服务器透传NVIDIA TESLA  T4卡

开始测试

服务器操作系统,网络配置好之后,接下来就是把我们的NVIDIA TESLA T4的卡插进服务器中的盖上机箱,使用lspci命令看到能识别到这个GPU卡,但是使用nvidia-smi命令却查不到GPU卡的信息
国产化服务器透传NVIDIA TESLA  T4卡
经过一番查询,发现华为官方的说法,觉得可能驱动程序没有安装,所以导致NVIDIA-SMI与NVIDIA无法通信

国产化服务器透传NVIDIA TESLA  T4卡
所以去NVIDIA的官网下载驱动程序
因为kylin v10 SP1是基于CentOS 8做的所以这里我们选择Linux aarch64-bit RHEL8,一定要是aarch的,因为是ARM架构的,不能用x86的包
国产化服务器透传NVIDIA TESLA  T4卡
选择特定的版本进入下载页面,单击【DOWNLOAD】。如下图所示:

国产化服务器透传NVIDIA TESLA  T4卡
如有填写个人信息的页面可选择直接跳过,当出现以下页面时,右键单击【AGREE&DOWNLOAD】并选择菜单中的【复制链接地址】。如下图所示:
国产化服务器透传NVIDIA TESLA  T4卡
然后进入到服务器使用wget命令下载
国产化服务器透传NVIDIA TESLA  T4卡
或者可以在本地系统下载 NVIDIA 安装包,再上传到 GPU 实例的服务器。
安装驱动可能会遇到警告,不用管直接跳过,遇到报错的话需要中止安装,排完错在安装
大致会遇到的几种报错:
国产化服务器透传NVIDIA TESLA  T4卡
驱动安装成功之后,使用nvidia-smi查看GPU卡的信息
国产化服务器透传NVIDIA TESLA  T4卡
折腾半天,终于搞好了。那如果安装了CUDA,就可以使用这张显卡做一些事情了,比如深度学习等等,这篇博客就不再深入记录了,放一张安装CUDA之后的成功显示。感兴趣的话有时间再倒腾
国产化服务器透传NVIDIA TESLA  T4卡

本文地址:https://blog.csdn.net/Tong89_xi/article/details/110522873