-
2021-08-30 15:29:05更多相关内容
-
大数据技术基础实验报告-HDFS常用操作命令.doc
2021-08-21 08:52:58大数据技术基础实验报告-HDFS常用操作命令 -
HDFS常用操作命令
2021-12-21 14:19:37HDFS中的一些常用指令,主要包括上传、下载和对文件系统的操作HDFS常用操作命令包括:上传、下载和对HDFS进行直接操作。
可以在启动好所需要的服务后,打开链接 http://hadoop102:9870/ 选择【utilities】->【Browse the file system】用可视化界面查看文件系统中的文件存储情况。
上传
可以先进入hadoop根目录,如/opt/module/hadoop-x.x.x/
(1)-moveFromLocal:从本地移动到HDFS(剪切粘贴)
vim volA.txt hadoop fs -moveFromLocal ./volA.txt /basicFolder
(2)-copyFromLocal:从本地拷贝到HDFS
vim volB.txt hadoop fs -moveFromLocal colB.txt /basicFolder
(3)-put:从本地拷贝到HDFS,等于上面的(2),但put更加常用
vim volC.txt hadoop fs -put colC.txt /basicFolder
(4)-appendToFile:追加一个文件的内容到指定文件末尾,HDFS只能追加,不能随机修改。
vim item1.txt hadoop fs -appendToFIle item1.txt /basicFolder/colA.txt
下载
(1)-copyToLocal:从HDFS中将指定文件拷贝到本地
hadoop fs -copyToLocal /basicFolder/volA.txt ./
(2)-get:从HDFS中将指定文件拷贝到本地,等于上面的(1),这个更常用。另外,在拷贝的过程中可以重命名文件。
hadoop fs -get /basicFolder/volA.txt ./volA2.txt
直接操作
(1)直接列出这些零碎操作,这些操作与linux中的操作很相像。
#浏览目录 -ls hadoop fs -ls / hadoop fs -ls /basicFolder #查看文件内容 -cat hadoop fs -cat /basicFolder/volA.txt #修改文件权限和所属权限 -chmod -chown -chgrp hadoop fs -chmod 666 /basicFolder/volA.txt hadoop fs -chown xunn:xunn /basicFolder/volA.txt #创建文件夹(路径) -mkdir hadoop fs -mkdir /secondFolder #将一个文件拷贝到一个指定文件夹下(在HDFS中) hadoop fs -cp /basicFolder/volA.txt /secondFolder #移动指定文件到指定文件夹下(在HDFS中) hadoop fs -mv /basicFolder/volB.txt /secondFolder hadoop fs -mv /basicFolder/volC.txt /secondFolder #显示文件末尾内容(最大1kb) -tail #因为文件只能以追加的形式修改,所以文件末尾信息是最新的,即更加关注文件末尾内容 hadoop fs -tail /basicFolder/volA.txt #删除指定文件或文件夹 -rm hadoop fs -rm /basicFolder/volA.txt #递归删除指定目录和目录里面的内容 -rm -r hadoop fs -rm -r /basicfolder #统计文件夹大小 -du #统计当前文件夹内每个文件 hadoop fs -du -h /secondFolder #只统计当前文件夹(总的) hadoop fs -du -s -h /secondFolder #显示的结果有两个数,前者是大小,后者是所有备份的大小,是前者的整数倍。
(2)修改HDFS中文件的副本数(set replication)。其中,每台机器最多只会存一个副本。也可在页面中修改。
hadoop fs -setrep 5 /secondFolder/volA.txt
-
大数据笔记 | HDFS 常用操作命令
2021-11-16 14:33:06既然 HDFS 是文件系统,那么它必然有一套对文件管理的命令,这里介绍一下 HDFS 常用的文件管理命令。 一、HDFS 命令前缀 所有操作 HDFS 的命令都需要前缀,它的前缀有两种,分别是 hadoop fs 或 hdfs dfs ...目录
HDFS 是 Hadoop Distributed File System 的简写,即 Hadoop 分布式文件系统。它是 Hadoop 项目的核心子项目,它为大数据分布式计算提供了海量数据的存储与管理。
既然 HDFS 是文件系统,那么它必然有一套对文件管理的命令,这里介绍一下 HDFS 常用的文件管理命令。
一、HDFS 命令前缀
所有操作 HDFS 的命令都需要前缀,它的前缀有两种,分别是 hadoop fs 或 hdfs dfs 两种。可以通过 hadoop fs -help 或 hdfs dfs -help 来查看其帮助文件。比如:
$ hadoop fs -help ls -ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [<path> ...] : List the contents that match the specified file pattern. If path is not specified, the contents of /user/<currentUser> will be listed. For a directory a list of its direct children is returned (unless -d option is specified). Directory entries are of the form: permissions - userId groupId sizeOfDirectory(in bytes) modificationDate(yyyy-MM-dd HH:mm) directoryName and file entries are of the form: permissions numberOfReplicas userId groupId sizeOfFile(in bytes) modificationDate(yyyy-MM-dd HH:mm) fileName -C Display the paths of files and directories only. -d Directories are listed as plain files. -h Formats the sizes of files in a human-readable fashion rather than a number of bytes. -q Print ? instead of non-printable characters. -R Recursively list the contents of directories. -t Sort files by modification time (most recent first). -S Sort files by size. -r Reverse the order of the sort. -u Use time of last access instead of modification for display and sorting.
或者使用 hdfs dfs 来查看帮助,命令如下:
$ hdfs dfs -help ls -ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [<path> ...] : List the contents that match the specified file pattern. If path is not specified, the contents of /user/<currentUser> will be listed. For a directory a list of its direct children is returned (unless -d option is specified). Directory entries are of the form: permissions - userId groupId sizeOfDirectory(in bytes) modificationDate(yyyy-MM-dd HH:mm) directoryName and file entries are of the form: permissions numberOfReplicas userId groupId sizeOfFile(in bytes) modificationDate(yyyy-MM-dd HH:mm) fileName -C Display the paths of files and directories only. -d Directories are listed as plain files. -h Formats the sizes of files in a human-readable fashion rather than a number of bytes. -q Print ? instead of non-printable characters. -R Recursively list the contents of directories. -t Sort files by modification time (most recent first). -S Sort files by size. -r Reverse the order of the sort. -u Use time of last access instead of modification for display and sorting.
二、ls 命令
ls 命令用来查看 HDFS 系统中的目录和文件,命令如下:
$ hadoop fs -ls /
也可以通过给 ls 添加 -R 参数来递归列出要查看目录下的所有目录和文件,命令如下:
$ hadoop fs -ls -R /
由于目前在 HDFS 中并没有任何文件和目录,因此这里没有显示任何的结果。
三、put 命令
put 命令用于将本地文件上传到 HDFS 系统中,命令如下:
$ hadoop fs -put test.txt / $ hadoop fs -ls / Found 1 items -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:22 /test.txt
通过 -put 命令将本地当前目录下的 test.txt 文件上传到了 HDFS 的 / 目录下,通过 -ls 命令可以看到文件已经上传到 HDFS 系统中了。
四、moveFromLocal 命令
将本地文件移动到 HDFS 文件系统中,并将本地的文件进行删除,命令如下:
$ ll 总用量 84804 -rw-rw-r--. 1 hadoop hadoop 5 11月 7 13:27 abc.txt $ hadoop fs -moveFromLocal abc.txt / $ hadoop fs -ls / Found 2 items -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:27 /abc.txt -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:22 /test.txt
将本地的 abc.txt 文件上传到 HDFS 的 / 目录下,通过 -ls 命令查看 / 目录下已经有了 abc.txt 文件,再来查看本地文件,本地的 abc.txt 文件已经被移除。
五、get 命令
get 命令用来将 HDFS 文件系统中的文件下载到本地,下载时的文件名不能与本地文件相同,否则会提示文件已存在。命令如下:
$ hadoop fs -get /abc.txt /home/hadoop/ $ ll 总用量 84804 -rw-r--r--. 1 hadoop hadoop 5 11月 7 13:42 abc.txt
下载文件时确保文件不重名,否则提示文件已存在,命令如下:
$ hadoop fs -get / /home/hadoop/ get: `/home/hadoop/abc.txt': File exists get: `/home/hadoop/test.txt': File exists
六、rm 命令
rm 命令用来删除 HDFS 系统中的文件或文件夹,每次可以删除多个文件或目录,命令如下:
$ hadoop fs -rm /test.txt Deleted /test.txt $ hadoop fs -ls / Found 1 items -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:27 /abc.txt
七、mkdir 命令
mkdir 命令用来在 HDFS 系统中创建目录,可以使用 -p 参数创建多级目录,即当父目录不存在时,则自动创建,若不使用 -p 参数,当父目录不存在时则会提示文件或目录不存在。命令如下:
$ hadoop fs -mkdir /test $ hadoop fs -mkdir /abc/abc mkdir: `/abc/abc': No such file or directory $ hadoop fs -mkdir -p /abc/abc
八、cp 命令
cp 命令在 HDFS 文件系统中用于文件的复制,命令如下:
$ hadoop fs -ls / Found 3 items drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:47 /abc -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:27 /abc.txt drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:47 /test $ hadoop fs -cp /abc.txt /abc/ $ hadoop fs -ls -R / drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:49 /abc drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:47 /abc/abc -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:49 /abc/abc.txt -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:27 /abc.txt drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:47 /test
通过 cp 命令将 /abc.txt 文件复制到了 /abc/ 目录下,然后使用 ls -R 来递归查看目录。
九、mv 命令
mv 命令用来在 HDFS 文件系统下完成移动的功能,也可以用来进行重命名。命令如下:
hadoop fs -mv /abc/abc.txt /test/ [hadoop@centos01 ~]$ hadoop fs -ls -R / drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:52 /abc drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:47 /abc/abc -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:27 /abc.txt drwxr-xr-x - hadoop supergroup 0 2021-11-07 13:52 /test -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:49 /test/abc.txt
从上面的命令中可以看出,/abc/abc.txt 文件被移动到了 /test/ 目录下。再来看下它的重命名功能:
$ hadoop fs -mv /test/abc.txt /test/abcabc.txt $ hadoop fs -ls /test/ Found 1 items -rw-r--r-- 2 hadoop supergroup 5 2021-11-07 13:49 /test/abcabc.txt
通过 ls 命令可以看到,abc.txt 已经被重命名为了 abcabc.txt。
十、cat 命令
cat 命令用来输出 HDFS 文件系统中某个文件的所有内容,命令如下:
$ hadoop fs -cat /test/abcabc.txt 1234 $ hadoop fs -cat /abc.txt 1234
十一、appendToFile 命令
将单个或多个文件的内容从本地系统追加到 HDFS 系统的文件中,命令如下:
$ hadoop fs -appendToFile abc.txt /abc.txt $ hadoop fs -cat /abc.txt 1234 1234
可以看到,/abc.txt 的内容已经发生了改变。
十二、总结
HDFS 关于文件的基本操作与 Linux 系统命令的基本是一样的,只是 HDFS 命令增加了 hadoop fs 这样的前缀。如果对 Linux 系统命令有些了解,那么 HDFS 的基本操作命令也会非常容易的上手。
-
HDFS常用操作命令 DFS
2022-03-08 13:53:46查看文件常用命令 命令格式 1.hdfs dfs -ls path 查看文件列表 2.hdfs dfs -lsr path 递归查看文件列表 3.hdfs dfs -du path 查看path下的磁盘情况,单位字节 使用示例 1.hdfs dfs -ls / 查看当前目录 2.hdfs...
查看帮助
hdfs dfs –help
查看文件常用命令
- 命令格式
1.hdfs dfs -ls path 查看文件列表
2.hdfs dfs -lsr path 递归查看文件列表
3.hdfs dfs -du path 查看path下的磁盘情况,单位字节 - 使用示例
1.hdfs dfs -ls / 查看当前目录
2.hdfs dfs - lsr / 递归查看当前目录
创建文件夹
- 命令格式
hdfs dfs -mkdir path - 使用用例
hdfs dfs -mkdir /user/iron
注:该命令可递归创建文件夹,不可重复创建,在Linux文件系统中不可见
创建文件
- 命令格式
hdfs dfs -touchz path - 使用用例
hdfs dfs -touchz /user/iron/iron.txt
注:该命令不可递归创建文件即当该文件的上级目录不存在时无法创建该文件,可重复创建但会覆盖原有的内容
复制文件和目录
- 命令格式
hdfs dfs -cp 源目录 目标目录 - 使用用例
hdfs dfs -cp /user/iron /user/iron01
注:该命令会将源目录的整个目录结构都复制到目标目录中
hdfs dfs -cp /user/iron/* /user/iron01
注:该命令只会将源目录中的文件及其文件夹都复制到目标目录中
移动文件和目录
- 命令格式
hdfs dfs -mv 源目录 目标目录 - 使用用例
hdfs dfs -mv /user/iron /user/iron01
赋予权限
- 命令格式
hdfs dfs -chmod [权限参数][拥有者][:[组]] path - 使用用例
hdfs dfs -chmod 777 /user/*
注:该命令是将user目录下的所用文件及其文件夹(不包含子文件夹中的文件)赋予最高权限:读,写,执行
777表示该用户,该用户的同组用户,其他用户都具有最高权限
上传文件
- 命令格式
hdfs dfs -put 源文件夹 目标文件夹 - 使用用例
hdfs dfs -put /home/hadoop01/iron /user/iron01
注:该命令上传Linux文件系统中iron整个文件夹
hdfs dfs -put /home/hadoop01/iron/* /user/iron01
注:该命令上传Linux文件系统中iron文件夹中的所有文件(不包括文件夹)
类似命令:
hdfs dfs -copyFromLocal 源文件夹 目标文件夹 作用同put
hdfs dfs -moveFromLocal 源文件夹 目标文件夹 上传后删除本地
下载文件
- 命令格式
hdfs dfs -get源文件夹 目标文件夹 - 使用用例
hdfs dfs -get /user/iron01 /home/hadoop01/iron
注:该命令下载hdfs文件系统中的iron01整个文件夹到Linux文件系统中
hdfs dfs -get /user/iron01/* /home/hadoop01/iron
注:该命令下载hdfs文件系统中的iron01整个文件夹到Linux文件系统中(不包含文件夹)
类似命令
hdfs dfs -copyToLocal 源文件夹 目标文件夹 作用同get
hdfs dfs -moveToLocal 源文件夹 目标文件夹 get后删除源文件
查看文件夹中有多少个文件
- hdfs dfs -count /路径
查看hdfs的总空间
- hdfs dfs -df /路径
- hdfs dfs -df -h /路径
查看文件内容
- 命令格式
hadoop fs -cat path 从头查看这个文件
hadoop fs -tail path 从尾部查看最后1K - 使用用例
hadoop fs -cat /userjzl/home/book/1.txt
hadoop fs -tail /userjzl/home/book/1.txt
删除文件
- 命令格式
hdfs dfs -rm 目标文件
hdfs dfs -rm -r 目标文件 递归删除(慎用) - 使用用例
hdfs dfs -rm /user/test.txt 删除test.txt文件
hdfs dfs -rm -r /user/testdir 递归删除testdir文件夹
注:rm不可以删除文件夹
查询分区错误文件
- 命令格式
hdfs fsck 目标路径 -openforwrite
修复错误分区
- 命令格式
hdfs debug recoverLease -path 错误文件
递归列出hdfs上某个路径下文件夹、文件数
- 命令格式
hadoop fs -ls 查询路径 | grep "^d" | awk '{print $NF}' |xargs hadoop fs -count | sort -n -r -k 2
注: sort的使用
语法:
sort [选项] ... [文件] ...
选项:
-b:忽略前面空格。
-c:测试文件是否已经排序。
-d:根据字典顺序排序,仅比较数字 字母 空格等字符。
-f:忽略大小写。
-i:仅比较可打印字符。
-n:纯数字排列
-R:根据哈希值随机排序。
-r:反向,颠倒顺序。
-k:定义排序关键字。原来的:第几个区间,与t相辅。
-t:分隔符
-m:仅仅合并已经排序好的文件,不执行排序操作。
-s:稳定的排序算法。
-o:排序结果写入文件,而不是标准输出到设备。
-u:相同的行只留一行
-M:月份
- 命令格式
-
hadoop HDFS常用文件操作命令
2022-04-03 10:20:48hadoop HDFS常用文件操作命令 命令基本格式: hadoop fs -cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件 hadoop fs -ls /dir 1hadoop fs -ls -R /dir --列出hdfs文件系统所有的目录和文件 2.put ... -
HDFS的常用命令
2021-03-22 10:49:14HDFS的常用命令 一、查看相关命令 二、文件及目录相关命令 三、文件的上传与下载 四、统计相关命令 eclipse连接Hadoop eclipse 实现 Hdfs java API 简单熟悉HDFS的常用命令 Usage: hadoop fs [generic options]: [-... -
HDFS常用文件操作命令汇总
2021-12-26 10:00:11常用的hdfs文件操作命令总结 -
hadoop - hadoop2.6 伪分布式 示例 wordcount 分词 和 hdfs常用操作命令
2016-01-21 20:29:332.hdfs 命令操作 说明:我这里hadoop进行了path 变量配置,所以可以使用 hadoop命令,如果你没有配置的话,看下篇文章进行配置或者 进入 hadoop 根目录 ,使用 bin目录下的hadoop 执行 hdfs 操作; 2.1 fs -... -
HDFS学习笔记(二):HDFS 常用操作命令大全(Hadoop版本3.3.1)
2022-07-22 15:16:08hdfs 常见命令汇总 -
HDFS常用Shell命令
2021-11-01 12:58:00大多数HDFS Shell命令的行为和对应的Unix Shell命令类似,主要不同之处是HDFS Shell命令...HDFS文件操作命令 -mkdir:创建文件夹 -ls:显示当前目录下所有文件 -du -count -touchz -mv -cp -rm -put .. -
熟悉常用的HDFS操作(附录HDFS常用命令)
2022-04-27 01:26:23文章目录1. 学习目的2. 学习内容3. 实验一3.1 追加文本3.2 覆盖文本3.3 脚本完成4. 实验二4.1 下载文件脚本4.2 输出文件内容脚本4.3 显示单个文件信息脚本4.4 ...2、熟练使用HDFS操作常用的Shell命令; 3、熟悉HDFS操 -
hadoop HDFS常用操作命令
2020-01-07 15:20:00hadoop HDFS常用操作命令 命令基本格式: hadoop fs -cmd < args > 1.ls hadoop fs -ls / 列出hdfs文件系统根目录下的目录和文件 hadoop fs -ls -R / 列出hdfs文件系统所有的目录和文件 2.put hadoop fs -put &... -
《进击大数据》系列教程之hdfs常用操作命令
2020-12-23 19:23:15一、HDFS常用操作命令 查看根目录下的文件 hadoop fs -ls hdfs://master:9999/ 或hadoop fs -ls / hadoop fs -ls -h hdfs://master:9999/ 或hadoop fs -ls -h / 增加-h参数,使文件大小可读,-d 只显示目录 -R... -
HDFS常用操作命令练习
2020-04-01 18:53:19练习在全分布式模式下启动了HDFS集群以及YARN集群 我的HDFS主节点配置在master,YARN管理主节点配置在slave1上 一、启动HDFS 在master主机下: cd /opt/apps/hadoop-2.7.3/sbin start-dfs.sh 如果是第一次启动需要... -
HDFS 常用命令
2020-12-18 22:12:24hadoop fs -命令1、put:向hdfs 上传文件:例如:hadoop fs -put test.log /home/2、cat:将路径指定文件的内容输出到stdout。3、chgrp:改变文件所属的组4、chmod:改变文件所属的权限5、chown:改变文件的拥有者6... -
HDFS常用命令的学习
2022-03-29 15:15:39HDFS常用命令的学习 文章目录HDFS常用命令的学习1. hadoop fs,hadoop dfs,hdfs fs,hdfs dfs 区别2. Hadoop 命令3. HDFS 常用命令命令的使用常用命令示例小结hdfs 与 getconf结合使用hdfs 与 dfsadmin结合使用hdfs 与...