2019-01-25 10:07:34 paulkg12 阅读数 548

linux中diff命令用法

diff 命 令是 linux上非常重要的工具,用于比较文件的内容,特别是比较两个版本不同的文件以找到改动的地方。diff在命令行中打印每一个行的改动。最新版 本的diff还支持二进制文件。diff程序的输出被称为补丁 (patch),因为Linux系统中还有一个patch程序,可以根据diff的输出将 a.c的文件内容更新为b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。

1.命令格式:

diff[参数][文件1或目录1][文件2或目录2]

2.命令功能:

diff 命令能比较单个文件或者目录内容。如果指定比较的是文件,则只有当输入为文本文件时才有效。以逐行的方式,比较文本文件的异同处。如果指定比较的是目录的 的时候,diff 命令会比较两个目录下名字相同的文本文件。列出不同的二进制文件、公共子目录和只在一个目录出现的文件。

notes

如果两个文件相同,那么没有输出

输出的是两个文件不同的地方

菜鸟教程ref

http://www.runoob.com/linux/linux-comm-diff.html

2018-12-11 15:25:43 lusic01 阅读数 384

linux比较两个文件的不同(6/21)

cmp 命令:比较任意两个类型的文件,且吧结果输出到标准输出,默认文件相同不输出,不同的文件输出差异

必要参数

-c 显示不同的信息
-l 列出所有的不同信息
-s 错误信息不提示
 选择参数

-i<字符数> 指定字符数目
-v 显示版本信息
--help 显示帮助信息

【函数的返回值】

0 :文件时同样的
1 :文件是不同的
>1:发生错误

comm将逐行比较已经排序的两个文件。显示结果包括3列:

第1列为只在file1中找到的行;第2列为只在file2中找到的行;第3列为两个文件的公用行。

 参数

参数file1file2comm要比较的文件的路径名。用连字符(-)来替代file1或者file2时,comm将从标准输入读取输入信息

 选项

-1              不显示第1列(即不显示只在file1中找到的行)

-2              不显示第2列(即不显示只在file2中找到的行)

-3              不显示第3列(即不显示在两个文件中都找到的行)

 注意

如果文件没有排序,comm就不能正常的工作

第2列的没一行前面有一个制表符,第3列中的每一行前面有两个制表符

diff 命令是 linux上非常重要的工具,用于比较文件的内容,特别是比较两个版本不同的文件以找到改动的地方。diff在命令行中打印每一个行的改动。最新版本的diff还支持二进制文件。diff程序的输出被称为补丁 (patch),因为Linux系统中还有一个patch程序,可以根据diff的输出将a.c的文件内容更新为b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。

diff 命令能比较单个文件或者目录内容。如果指定比较的是文件,则只有当输入为文本文件时才有效。以逐行的方式,比较文本文件的异同处。如果指定比较的是目录的 的时候,diff 命令会比较两个目录下名字相同的文本文件。列出不同的二进制文件、公共子目录和只在一个目录出现的文件。

3.命令参数:

-  指定要显示多少行的文本。此参数必须与-c或-u参数一并使用。

 -a或--text  diff预设只会逐行比较文本文件。

-b或--ignore-space-change  不检查空格字符的不同。

-B或--ignore-blank-lines  不检查空白行。

-c  显示全部内文,并标出不同之处。

-C或--context  与执行"-c-"指令相同。

-d或--minimal  使用不同的演算法,以较小的单位来做比较。

-D或ifdef  此参数的输出格式可用于前置处理器巨集。

-e或--ed  此参数的输出格式可用于ed的script文件。

-f或-forward-ed  输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处。

-H或--speed-large-files  比较大文件时,可加快速度。

-l或--ignore-matching-lines  若两个文件在某几行有所不同,而这几行同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异。

-i或--ignore-case  不检查大小写的不同。

-l或--paginate  将结果交由pr程序来分页。

-n或--rcs  将比较结果以RCS的格式来显示。

-N或--new-file  在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录:文件A若使用-N参数,则diff会将文件A与一个空白的文件比较。

-p  若比较的文件为C语言的程序码文件时,显示差异所在的函数名称。

-P或--unidirectional-new-file  与-N类似,但只有当第二个目录包含了一个第一个目录所没有的文件时,才会将这个文件与空白的文件做比较。

-q或--brief  仅显示有无差异,不显示详细的信息。

-r或--recursive  比较子目录中的文件。

-s或--report-identical-files  若没有发现任何差异,仍然显示信息。

-S或--starting-file  在比较目录时,从指定的文件开始比较。

-t或--expand-tabs  在输出时,将tab字符展开。

-T或--initial-tab  在每行前面加上tab字符以便对齐。

-u,-U或--unified=  以合并的方式来显示文件内容的不同。

-v或--version  显示版本信息。

-w或--ignore-all-space  忽略全部的空格字符。

-W或--width  在使用-y参数时,指定栏宽。

-x或--exclude  不比较选项中所指定的文件或目录。

-X或--exclude-from  您可以将文件或目录类型存成文本文件,然后在=中指定此文本文件。

-y或--side-by-side  以并列的方式显示文件的异同之处。

--help  显示帮助。

--left-column  在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容。

--suppress-common-lines  在使用-y参数时,仅显示不同之处。

比较后的不同之处以指定的形式列出,如下所示:

n1 a n3,n4  
n1,n2 d n3  
n1,n2 c n3,n4 

其中,字母"a"、"d"、"c"分别表示添加、删除及修改操作。而"n1"、"n2"表示在文件1中的行号,"n3"、"n4"表示在文件2中的行号。

注意:以上说明指定了两个文件中不同处的行号及其相应的操作。在输出形式中,每一行后面将跟随受到影响的若干行。其中,以<开始的行属于文件1,以>开始的行属于文件2。

11,12d10″表示第一个文件比第二个文件多了第11和12行。

diff log2013.log log2014.log  -y -W 50

“|”表示前后2个文件内容有不同

 

“<”表示后面文件比前面文件少了1行内容

 

“>”表示后面文件比前面文件多了1行内容

2,4c2,4 的含义是:第一个文件中的第[2,4]行(注意这是一个闭合区间,包括第2行和第4行)需要做出修改才能与第二个文件中的[2,4]行相匹配。
接下来的内容则告诉我们需要修改的地方,前面带 < 的部分表示左边文件的第[2,4]行的内容,而带> 的部分表示右边文件的第[2,4]行的内容,中间的 --- 则是两个文件内容的分隔符号。

diff log2014.log log2013.log  -u

--- log2014.log 2012-12-07 18:01:54.000000000 +0800

 

+++ log2013.log 2012-12-07 16:36:26.000000000 +0800

“—“表示变动前的文件,”+++”表示变动后的文件。

diff log2013.log log2014.log  -c

 

 

2

3

4

5

“+” 比较的文件的后者比前着多一行

 

“-” 比较的文件的后者比前着少一行

 

“!” 比较的文件两者有差别的行

comm命令的参数

-1   不显示只在第1个文件里出现过的列。
-2   不显示只在第2个文件里出现过的列。
-3   不显示只在第1和第2个文件里出现过的列。

comm命令是一个非常简洁的命令,其只有两个参数。不过三个参数也结常要组合使用,我们常用的用法如下:

comm - 12     就只显示在两个文件中都存在的行;
comm - 23    只显示在第一个文件中出现而未在第二个文件中出现的行;
comm - 123  则什么也不显示。

comm找出文件2中有,文件1中没有的行:

cat /etc/dhcpd.conf|grep "fixed-address"|grep -v ^#|awk '{print $NF}'|sed 's/;//g'|sort > /tmp/1.txt
arp -n|grep ether|grep -v eth0|awk '{ print $1}'|sort >/tmp/2.txt
comm -23 2.txt 1.txt

注:两个文件的内容在比较前,一定要进行sort排序。不然输出的结果将是错误的。

方法二:diff命令比较

diff命令是一个比较经典的文本比较工具了,diff命令较comm的参数要多。其经常和patch命令组合使用,进行补丁升级。其默认使用的是-a参数,即逐行比较两个文件之间的不同。此处我们要实现想要得到的结果,还需要配合grep和awk实用:

diff 2.txt 1.txt |grep "<"|awk ' $1 = " " '

注:此处也发现,在使用diff命令进行比较时,也需要预先对经比较的文件进行sort排序,不然输出的结果同样是不正确的。

方法三:awk实现

awk应该算是shell常用命令中的泰山北斗了,几乎很多其他命令能完成的工作,awk都能完成(只不过有些写起来可能比较复杂)。本例中也不例外:

awk 'NR==FNR{a[$0]++} NR>FNR&&!a[$0]' 1.txt 2.txt

找出两个文件之间的相同部分可以使用

awk 'NR==FNR{a[$0]++} NR>FNR&&a[$0]'  1.txt 2.txt

 

下面的两个语句也可以换成:

awk  'NR==FNR{a[$0]}NR>FNR{ if(!($1 in a)) print $0}' file1 file2 找出文件2中不同的值
awk  'NR==FNR{a[$0]}NR>FNR{ if($1 in a)    print $0}' file1 file2 找出两文件中相同的值

 

注:

1、awk实现时,并不需要事先对两个文件进行sort排序,

2、注意和上两个命令中两个文件的放置顺序是不同的。三种实现方法,文件的顺序一定颠倒,颠倒了,效果就刚好想反了,就变成找出文件1中有文件2中没有的行了。

方法四:grep误人子弟法

网上另外流传一个错误的方法,即通过grep命令实现:

grep -v -f 1.txt 2.txt

经测试,无论我事先是否对两个文件进行sort倒序,此方法输出的结果,发现都是不正确的。

2016-03-20 19:53:44 scaleqiao 阅读数 1032

linux中的diff命令可以比较两个文件的不同,并输出友好的结果,方便查看。其中-y表示输出两列对比,而'--suppress-common-lines'屏蔽了相同的行。

$ diff --suppress-common-lines default.cf osd.4.cf -y
name = client.admin					      |	name = osd.4
debug_lockdep = 0/1					      |	debug_lockdep = 0/0
debug_context = 0/1					      |	debug_context = 0/0
debug_crush = 1/1					      |	debug_crush = 0/0
debug_mds = 1/5						      |	debug_mds = 0/0
debug_mds_balancer = 1/5				      |	debug_mds_balancer = 0/0
debug_mds_locker = 1/5					      |	debug_mds_locker = 0/0
debug_mds_log = 1/5					      |	debug_mds_log = 0/0
debug_mds_log_expire = 1/5				      |	debug_mds_log_expire = 0/0
debug_mds_migrator = 1/5				      |	debug_mds_migrator = 0/0
debug_buffer = 0/1					      |	debug_buffer = 0/0
debug_timer = 0/1					      |	debug_timer = 0/0
debug_filer = 0/1					      |	debug_filer = 0/0
debug_objecter = 0/1					      |	debug_objecter = 0/0
debug_rados = 0/5					      |	debug_rados = 0/0
debug_rbd = 0/5						      |	debug_rbd = 0/0
debug_journaler = 0/5					      |	debug_journaler = 0/0
debug_objectcacher = 0/5				      |	debug_objectcacher = 0/0
debug_client = 0/5					      |	debug_client = 0/0
debug_osd = 0/5						      |	debug_osd = 0/0
debug_optracker = 0/5					      |	debug_optracker = 0/0
debug_objclass = 0/5					      |	debug_objclass = 0/0
debug_filestore = 1/3					      |	debug_filestore = 0/0
debug_journal = 1/3					      |	debug_journal = 0/0
debug_ms = 0/5						      |	debug_ms = 0/0
debug_mon = 1/5						      |	debug_mon = 0/0
debug_monc = 0/10					      |	debug_monc = 0/0
debug_paxos = 1/5					      |	debug_paxos = 0/0
debug_tp = 0/5						      |	debug_tp = 0/0
debug_auth = 1/5					      |	debug_auth = 0/0
debug_finisher = 1/1					      |	debug_finisher = 0/0
debug_heartbeatmap = 1/5				      |	debug_heartbeatmap = 0/0
debug_perfcounter = 1/5					      |	debug_perfcounter = 0/0
debug_rgw = 1/5						      |	debug_rgw = 0/0
debug_asok = 1/5					      |	debug_asok = 0/0
debug_throttle = 1/1					      |	debug_throttle = 0/0

2017-12-23 22:18:50 yunyi4367 阅读数 5679

1.对要比较的两个文件进行排序

sort -r 1.txt -o 1.txt 
sort -r 2.txt -o 2.txt 

2.用script新建一个txt文件

script difference.txt

3.查找在2.txt文件中存在,在1.txt文件中不存在的命令

grep -vFf 1.txt 2.txt 

4.退出对difference.txt的编辑

exit

至此,2.txt文件中存在而1.txt文件中不存在的内容就会全部记录在difference.txt中。
想要得到1.txt文件中存在而2.txt文件中不存在的内容同理。

2018-05-07 19:46:42 SoaringLee_fighting 阅读数 471

转载:https://blog.csdn.net/mosesmo1989/article/details/51093631

diff 命令是 linux上非常重要的工具,用于比较文件的内容,特别是比较两个版本不同的文件以找到改动的地方。diff在命令行中打印每一个行的改动。最新版本的diff还支持二进制文件。diff程序的输出被称为补丁 (patch),因为Linux系统中还有一个patch程序,可以根据diff的输出将a.c的文件内容更新为b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。

1.命令格式:

diff[参数][文件1或目录1][文件2或目录2]

2.命令功能:

diff命令能比较单个文件或者目录内容。如果指定比较的是文件,则只有当输入为文本文件时才有效。以逐行的方式,比较文本文件的异同处。如果指定比较的是目录的的时候,diff 命令会比较两个目录下名字相同的文本文件。列出不同的二进制文件、公共子目录和只在一个目录出现的文件。

3.命令参数:

-  指定要显示多少行的文本。此参数必须与-c或-u参数一并使用。

 -a或--text diff预设只会逐行比较文本文件。

-b或--ignore-space-change  不检查空格字符的不同。

-B或--ignore-blank-lines  不检查空白行。

-c  显示全部内文,并标出不同之处。

-C或--context  与执行"-c-"指令相同。

-d或--minimal  使用不同的演算法,以较小的单位来做比较。

-D或ifdef  此参数的输出格式可用于前置处理器巨集。

-e或--ed  此参数的输出格式可用于ed的script文件。

-f或-forward-ed  输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处。

-H或--speed-large-files  比较大文件时,可加快速度。

-l或--ignore-matching-lines 若两个文件在某几行有所不同,而这几行同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异。

-i或--ignore-case  不检查大小写的不同。

-l或--paginate  将结果交由pr程序来分页。

-n或--rcs  将比较结果以RCS的格式来显示。

-N或--new-file  在比较目录时,若文件A仅出现在某个目录中,预设会显示:Onlyin目录:文件A若使用-N参数,则diff会将文件A与一个空白的文件比较。

-p  若比较的文件为C语言的程序码文件时,显示差异所在的函数名称。

-P或--unidirectional-new-file 与-N类似,但只有当第二个目录包含了一个第一个目录所没有的文件时,才会将这个文件与空白的文件做比较。

-q或--brief  仅显示有无差异,不显示详细的信息。

-r或--recursive  比较子目录中的文件。

-s或--report-identical-files  若没有发现任何差异,仍然显示信息。

-S或--starting-file  在比较目录时,从指定的文件开始比较。

-t或--expand-tabs  在输出时,将tab字符展开。

-T或--initial-tab  在每行前面加上tab字符以便对齐。

-u,-U或--unified=  以合并的方式来显示文件内容的不同。

-v或--version  显示版本信息。

-w或--ignore-all-space  忽略全部的空格字符。

-W或--width  在使用-y参数时,指定栏宽。

-x或--exclude  不比较选项中所指定的文件或目录。

-X或--exclude-from  您可以将文件或目录类型存成文本文件,然后在=中指定此文本文件。

-y或--side-by-side  以并列的方式显示文件的异同之处。

--help  显示帮助。

--left-column  在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容。

--suppress-common-lines  在使用-y参数时,仅显示不同之处。

4.使用实例:

实例1:比较两个文件

命令:

输出:

[root@localhost test3]# diff log2014.log log2013.log 

3c3

< 2014-03

---

> 2013-03

8c8

< 2013-07

---

> 2013-08

11,12d10

< 2013-11

< 2013-12

说明:

上面的“3c3”和“8c8”表示log2014.log和log20143log文件在3行和第8行内容有所不同;"11,12d10"表示第一个文件比第二个文件多了第11和12行。

diff 的normal 显示格式有三种提示:

a - add

c - change

d - delete

实例2:并排格式输出

命令:

diff log2013.log log2014.log -y -W 50

输出:

[root@localhost test3]# diff log2014.log log2013.log  -y -W 50

2013-01                 2013-01

2013-02                 2013-02

2014-03               | 2013-03

2013-04                 2013-04

2013-05                 2013-05

2013-06                 2013-06

2013-07                 2013-07

2013-07               | 2013-08

2013-09                 2013-09

2013-10                 2013-10

2013-11               <

2013-12               <

[root@localhost test3]# diff log2013.log log2014.log  -y -W 50

2013-01                 2013-01

2013-02                 2013-02

2013-03               | 2014-03

2013-04                 2013-04

2013-05                 2013-05

2013-06                 2013-06

2013-07                 2013-07

2013-08               | 2013-07

2013-09                 2013-09

2013-10                 2013-10

                      > 2013-11

                      > 2013-12

说明:

“|”表示前后2个文件内容有不同

<”表示后面文件比前面文件少了1行内容

>”表示后面文件比前面文件多了1行内容

实例3:上下文输出格式

命令:

diff log2013.log log2014.log -c

输出:

[root@localhost test3]# diff log2013.log log2014.log  -c

*** log2013.log 2012-12-07 16:36:26.000000000 +0800

--- log2014.log 2012-12-07 18:01:54.000000000 +0800

***************

*** 1,10 ****

  2013-01

  2013-02

! 2013-03

  2013-04

  2013-05

  2013-06

  2013-07

! 2013-08

  2013-09

  2013-10

--- 1,12 ----

  2013-01

  2013-02

! 2014-03

  2013-04

  2013-05

  2013-06

  2013-07

! 2013-07

  2013-09

  2013-10

+ 2013-11

+ 2013-12[root@localhost test3]# diff log2014.log log2013.log  -c

*** log2014.log 2012-12-07 18:01:54.000000000 +0800

--- log2013.log 2012-12-07 16:36:26.000000000 +0800

***************

*** 1,12 ****

  2013-01

  2013-02

! 2014-03

  2013-04

  2013-05

  2013-06

  2013-07

! 2013-07

  2013-09

  2013-10

- 2013-11

- 2013-12

--- 1,10 ----

  2013-01

  2013-02

! 2013-03

  2013-04

  2013-05

  2013-06

  2013-07

! 2013-08

  2013-09

  2013-10[root@localhost test3]#

说明:

这种方式在开头两行作了比较文件的说明,这里有三中特殊字符:

“+”比较的文件的后者比前着多一行

“-”比较的文件的后者比前着少一行

“!”比较的文件两者有差别的行

实例4:统一格式输出

命令:

diff log2014.log log2013.log -u

输出:

[root@localhost test3]# diff log2014.log log2013.log  -u

--- log2014.log 2012-12-07 18:01:54.000000000 +0800

+++ log2013.log 2012-12-07 16:36:26.000000000 +0800

@@ -1,12 +1,10 @@

 2013-01

 2013-02

-2014-03

+2013-03

 2013-04

 2013-05

 2013-06

 2013-07

-2013-07

+2013-08

 2013-09

 2013-10

-2013-11

-2013-12

说明:

它的第一部分,也是文件的基本信息:

---log2014.log 2012-12-07 18:01:54.000000000 +0800

+++log2013.log 2012-12-07 16:36:26.000000000 +0800

"---"表示变动前的文件,"+++"表示变动后的文件。

第二部分,变动的位置用两个@作为起首和结束。

   @@ -1,12 +1,10 @@

前面的"-1,12"分成三个部分:减号表示第一个文件(即log2014.log),"1"表示第1行,"12"表示连续12行。合在一起,就表示下面是第一个文件从第1行开始的连续12行。同样的,"+1,10"表示变动后,成为第二个文件从第1行开始的连续10行。

实例5:比较文件夹不同

命令:

diff  test3 test6

输出:

[root@localhosttest]# diff test3 test6

Onlyin test6: linklog.log

Onlyin test6: log2012.log

difftest3/log2013.log test6/log2013.log

1,10c1,3

<2013-01

<2013-02

<2013-03

<2013-04

<2013-05

<2013-06

<2013-07

<2013-08

<2013-09

<2013-10

---

>hostnamebaidu=baidu.com

>hostnamesina=sina.com

>hostnames=true

difftest3/log2014.log test6/log2014.log

1,12d0

<2013-01

<2013-02

<2014-03

<2013-04

<2013-05

<2013-06

<2013-07

<2013-07

<2013-09

<2013-10

<2013-11

<2013-12

Onlyin test6: log2015.log

Onlyin test6: log2016.log

Onlyin test6: log2017.log

[root@localhosttest]#

说明:

实例6:比较两个文件不同,并生产补丁

命令:

diff -ruN log2013.log log2014.log >patch.log

输出:

[root@localhost test3]# diff -ruN log2013.log log2014.log >patch.log

[root@localhost test3]# ll

总计 12

-rw-r--r-- 2 root root  80 12-07 16:36 log2013.log

-rw-r--r-- 1 root root  96 12-07 18:01 log2014.log

-rw-r--r-- 1 root root 248 12-07 21:33 patch.log

[root@localhost test3]# cat patc.log

cat: patc.log: 没有那个文件或目录

[root@localhost test3]# cat patch.log 

--- log2013.log 2012-12-07 16:36:26.000000000 +0800

+++ log2014.log 2012-12-07 18:01:54.000000000 +0800

@@ -1,10 +1,12 @@

 2013-01

 2013-02

-2013-03

+2014-03

 2013-04

 2013-05

 2013-06

 2013-07

-2013-08

+2013-07

 2013-09

 2013-10

+2013-11

+2013-12[root@localhost test3]#

说明:

实例7:打补丁

命令:

输出:

[root@localhost test3]# cat log2013.log

2013-01

2013-02

2013-03

2013-04

2013-05

2013-06

2013-07

2013-08

2013-09

2013-10[root@localhost test3]# patch log2013.log patch.log 

patching file log2013.log

[root@localhost test3]# 

[root@localhost test3]# cat log2013.log 

2013-01

2013-02

2014-03

2013-04

2013-05

2013-06

2013-07

2013-07

2013-09

2013-10

2013-11

2013-12[root@localhost test3]#

Linux 简单文件操作

阅读数 106

没有更多推荐了,返回首页