欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

武大超算各种记录

程序员文章站 2024-02-27 13:32:27
...

武大超算各种大坑记录

1.登陆和基础简介

登陆最开始是申请的时候老师发的邮件里面的账号和密码,需要自己修改密码,邮件里面有命令

自己的home/user的目录里面有project和workfs两个文件夹,存放东西安装软件都在这两个里面安装,不然亏死,外面的home/user目录只有1个g太惨了!!而且当1个g填满的话什么操作都做不了,bash.rc也不能改什么都不行。

如果有文件夹不能够更改什么的,有可能是因为之前被禁过号比如超算到期禁号等等,根据自己的问题问超算老师,加超算群

2.一些功能应用

1.module模块
module可以看超算上面有什么已经安装好的底层,有gcc从5到7的版本,也有cuda9,9.2,10,10.1,根据自己的需求module load,查看有哪些可以module avail,具体看下面的链接介绍module怎么应用:
超算module介绍链接

2.需要自己安装python
我直接安装的anaconda,cd到上面那两个文件夹哪个都行,按照非root的linux安装就行,最后改自己home/user下的bash里面的环境变量

3.gpu
gpu是付费的,需要跟导师申请,然后gpu–导师,一般有两种方式salloc和sbatch都可以连接上gpu

salloc:

salloc -A XXX(这里改成自己导师的名字) -p gpu --gres=gpu:4(这是申请导师的4块gpu,然后就进入节点了)
ssh 节点(进入节点)
module load XXX(自己需要的模块)
python XXX.py(或者编译C代码,matlab,java看自己需求)

用完了记得exit退出,不然一直在计费

sbatch:
武大超算各种记录

上面红线位置是需要填写的,还有gcc也是要填写的,如果load的是5.3或者别的记得换成自己用的。然后把这个提交,用srun提交作业,具体看下面介绍和群里老师发的介绍武大超算各种记录

4.pytorch安装
在官网查自己的cuda,什么系统等等去安装,记得load gcc高版本,不load gcc会用自带的Ubuntu14的gcc4.8,这个版本很低基本什么都干不了,管理员安装了高版本的。