【代码调试】使用华为云训练自己的代码
程序员文章站
2024-01-04 08:04:04
...
本人在华为云上调了很多代码,如果有什么问题,可以评论留言,看看能不能解决。
libNVVM cannot be found
错误提示libNVVM cannot be found. Do conda install cudatoolkit
。这个问题的来源是路径问题,并不是nvvm没有安装。nvvm在安装cuda的时候就安装了,解决办法可在参考这篇博客。但这个方法并不完全适用,华为云的“训练作业”中的“启动代码”是python脚本,并不是控制台。而bashrc文件是新开一个进程就会加载一遍。所以这里我们选择的方式是,在python脚本中,直接加入这两个路径:
import os
os.system('export NUMBAPRO_NVVM=/usr/local/cuda-9.0/nvvm/lib64/libnvvm.so && export NUMBAPRO_LIBDEVICE=/usr/local/cuda-9.0/nvvm/libdevice/ && echo $NUMBAPRO_NVVM && echo $NUMBAPRO_LIBDEVICE && cd VoteNet_KITTI && python train.py')
在一个指令中,先后加入NUMBAPRO_NVVM和NUMBAPRO_LIBDEVICE的变量,然后确认,然后运行训练脚本。