RuntimeError: Address already in use
程序员文章站
2022-07-15 17:04:31
...
TCP的端口被占用,在一台计算机上启动多个作业,例如,在具有8个GPU的计算机上进行2个4-GPU训练作业,需要为每个作业指定不同的端口(默认为29500),以避免通信冲突。
如果使用dist_train.sh启动训练作业,则可以在命令中设置端口。
一种解决方法是,运行程序的同时指定端口,端口号随意给出:
--master_port 29501 位置在执行的py文件之前
python -m torch.distributed.launch --master_port 66666 --use_env main.py
另一种方式,查找占用的端口号(在程序里 插入print输出),然后找到该端口号对应的PID值:netstat -nltp,然后通过kill -9 PID来解除对该端口的占用。
上一篇: 虚拟机与宿主机共享文件夹的设置办法
下一篇: 自然语言处理基础技术工具篇之Jieba
推荐阅读
-
开启Nginx时端口被占用提示:Address already in use
-
关于tomcat启动时报错Address already in use: JVM_Bind
-
启动tomcat时 错误: 代理抛出异常 : java.rmi.server.ExportException: Port already in use: 1099的解决办法
-
RuntimeError: Address already in use
-
win7端口号被占用Address already in use bind 解决方案
-
Address already in use: bind端口被占用的多种原因以及解决方案
-
端口号被占用解决方案 address already in use:jvm_bind
-
Address already in use: JVM_Bind:80 两种解决方案
-
[转] Address already in use: JVM_Bind错误的解决
-
「Python」Linux环境下启动Flask应用时失败,Error:Address already in use