Hadoop 实验: 熟悉常用的HDFS操作
程序员文章站
2024-03-23 08:05:04
...
文章目录
- 1. 利用Hadoop提供的Shell命令完成:
- (1)向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件;
- (2)从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;
- (3)将HDFS中指定文件的内容输出到终端中;
- (4)显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;
- (5)给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件相关信息;
- (6)提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;
- (7)提供一个HDFS的目录的路径,对该目录进行创建和删除操作。创建目录时,如果目录文件所在目录不存在则自动创建相应目录;删除目录时,由用户指定当该目录不为空时是否还删除该目录;
- (8)向HDFS中指定的文件追加内容,由用户指定内容追加到原有文件的开头或结尾;
- (9)删除HDFS中指定的文件;
- (10)删除HDFS中指定的目录,由用户指定目录中如果存在文件时是否删除目录;
- (11)在HDFS中,将文件从源路径移动到目的路径。
注意: WARN hdfs.DFSClient: DFSInputStream has been closed already 忽略这个问题就行
1. 利用Hadoop提供的Shell命令完成:
(1)向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件;
cd /usr/local/hadoop
./sbin/start-dfs.sh #启动hadoop
./bin/hdfs dfs -test -e text.txt
echo $?
touch local.txt
./bin/hdfs dfs -appendToFile local.txt text.txt
注意:
检查文件是否存在: hdfs dfs -test -e text.txt
(执行完这一句不会输出结果,需要继续输入命令 " echo $? ")
追加命令: ./bin/hdfs dfs -appendToFile local.txt text.txt
覆盖命令1: ./bin/hdfs dfs -copyFromLocal -f local.txt text.txt
覆盖命令2: ./bin/hdfs dfs -cp -f file:///home/hadoop/local.txt text.txt
也可以使用如下命令实现:
(如下代码可视为一行代码,在终端中输入第一行代码后,直到输入 fi 才会真正执行):
if $(./bin/hdfs dfs -test -e text.txt);
then $(./bin/hdfs dfs -appendToFile local.txt text.txt);
else $(./bin/hdfs dfs -copyFromLocal -f local.txt text.txt);
fi
(2)从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;
if $(./bin/hdfs dfs -test -e file:///home/hadoop/text.txt);
then $(./bin/hdfs dfs -copyToLocal text.txt ./text2.txt);
else $(./bin/hdfs dfs -copyToLocal text.txt ./text.txt);
fi
(3)将HDFS中指定文件的内容输出到终端中;
./bin/hdfs dfs -cat text.txt
(4)显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;
./bin/hdfs dfs -ls -h text.txt
(5)给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件相关信息;
./bin/hdfs dfs -ls -R -h /user/hadoop
(6)提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;
if $(./bin/hdfs dfs -test -d dir1/dir2);
then $(./bin/hdfs dfs -touchz dir1/dir2/filename);
else $(./bin/hdfs dfs -mkdir -p dir1/dir2 && ./bin/hdfs dfs -touchz dir1/dir2/filename);
fi
(7)提供一个HDFS的目录的路径,对该目录进行创建和删除操作。创建目录时,如果目录文件所在目录不存在则自动创建相应目录;删除目录时,由用户指定当该目录不为空时是否还删除该目录;
创建目录:./bin/hdfs dfs -mkdir -p dir1/dir2
删除目录:./bin/hdfs dfs -rmdir dir1/dir2
(如果目录非空则会提示not empty,不执行删除)强制删除目录:./bin/hdfs dfs -rm -R dir1/dir2
(8)向HDFS中指定的文件追加内容,由用户指定内容追加到原有文件的开头或结尾;
`追加到文件末尾`
./bin/hdfs dfs -appendToFile local.txt text.txt
`追加到文件开头: (由于没有直接的命令可以操作,方法之一是先移动到本地进行操作,再进行上传覆盖)`
./bin/hdfs dfs -get text.txt
cat text.txt >> local.txt
./bin/hdfs dfs -copyFromLocal -f text.txt text.txt
(9)删除HDFS中指定的文件;
./bin/hdfs dfs -rm text.txt
(10)删除HDFS中指定的目录,由用户指定目录中如果存在文件时是否删除目录;
`删除目录(如果目录非空则会提示not empty,不执行删除):`
./bin/hdfs dfs -rmdir dir1/dir2
`强制删除目录:`
./bin/hdfs dfs -rm -R dir1/dir2
(11)在HDFS中,将文件从源路径移动到目的路径。
./bin/hdfs dfs -mv text.txt text2.txt
上一篇: HDFS相关操作