• Linux下C语言编程

    2018-12-26 16:18:17
    第1章 Linux下C语言编程简介 本章将简要介绍一下什么是Linux,C语言的特点,程序开发的预备知识,Linux下C语言开发的环境,程序设计的特点和原则以及编码风格等。通过本章的学习,可以对在Linux下使用C语言编程有...

     

    1 LinuxC语言编程简介

    本章将简要介绍一下什么是Linux,C语言的特点,程序开发的预备知识,Linux下C语言开发的环境,程序设计的特点和原则以及编码风格等。通过本章的学习,可以对在Linux下使用C语言编程有一个基本的了解。

    1.1 Linux

    Linux是能够自由传播并继承了UNIX内核的操作系统,是对UNIX的简化和改进,它既保留了UNIX系统的高安全性,同时也使其操作更加简单方便,从而使单机用户也可以使用。UNIX内核指的是操作系统底层的核心程序代码。

    因为 Linux本身脱胎于UNIX系统,所以Linux程序与UNIX程序是十分相似的。事实上,UNIX下编写的各种程序基本上都可以在 Linux下编译和运行。此外,许多在UNIX操作系统下创建的一些商业化应用软件,其二进制形式几乎可以在不作任何修改的情况下直接运行在 Linux系统上。

    Linux是由芬兰的赫尔辛基大学 (Helsinki)学生Linus Torvalds把Minix 系统向x86移植的结果。当时 Linus 手边有个 Minix 系统(UNIX 的一个分支),他对这个操作系统相当有兴趣,由于当时他正好有一台个人计算机,他想把这个系统移植到该计算机(x86 架构)上来使用。由于受益于Stallman提倡的开放源代码(Open Source)思想,他得以接触到UNIX操作系统的一些源代码,并仔细研读了UNIX 的核心,然后去除较为繁复的核心程序,将它改写成能够适用于一般个人计算机的一种操作系统,即Linux系统的雏形。

    1992年1月,大概只有100人开始使用Linux,但他们为Linux的发展壮大作出了巨大贡献。他们对一些不合理的代码进行了改进,修补了代码错误并上传补丁。Linux的腾飞最关键的因素是获得了自由软件基金(FSF)的支持,他们制定了一个GNU计划,该计划的目标就是要编写一个完全免费的 UNIX版本——包括内核及所有相关的组件,可以让用户自由共享并且改写软件,而Linux正好符合他们的意愿。他们将Linux与其现有的GNU应用软件很好地结合起来,使Linux拥有了图形用户界面。

    提示:

    Linux 实际上只是提供了操作系统的内核;它实现了多任务和多用户功能,管理硬件,分配内存,激活应用程序的运行。对初学者来说,最重要的是要明白奇数的内核版本(比如 2.3、2.5、2.7)是实验用的、正在开发的内核。 稳定的、正式发行的内核版本号则是偶数的(比如 2.2、2.4、2.6)。

    1994年3月, Linux 1.0正式版发布,它的出现无异于网络的“自由宣言”。从此Linux用户迅速增加,Linux的核心开发小组也日渐强大。在Linux所包含的数千个文件中,有一个名为Credits的文件,里面列出了100多名对Linux有过重要贡献的黑客,包括他们的名字、地址以及所做的工作。其中的软件都是经过“优胜劣汰”的达尔文式的选择方式保存下来的。Linux的发展方法看起来很简单:所有黑客都可为其添加额外功能并完善其性能。所谓的β测试也不仅是修补漏洞,而是进行集成并进行更多的改进、创新。Linux发展过程中的这种随意性,造成了发展过程中出现了各种各样的Linux版本。

    提示:

    β测试是由软件的多个用户在一个或多个用户的实际使用环境下进行的测试。这些用户是与公司签定了支持产品预发行合同的外部客户,他们要求使用该产品,并愿意返回有关错误信息给开发者。开发者通常不在测试现场,因而,β测试是在开发者无法控制的环境下进行的软件现场应用。在β测试中,由用户记下遇到的所有问题,包括真实的以及主观认定的,定期向开发者报告,开发者在综合用户的报告之后,作出修改,最终将软件产品交付给全体用户使用。由于它处在整个测试的最后阶段,因此不能指望这时发现主要问题。同时,产品的所有手册文本也应该在此阶段完全定稿。

    Linux操作系统在短短的几年之内得到了非常迅猛的发展,这与Linux具有的良好特性是分不开的。Linux几乎包含了UNIX的全部功能和特性,同时又有自己的一些特点。概括地讲,Linux具有以下主要特性:

    ●       开放性

    开放性是指系统遵循世界标准规范,特别是遵循开放系统互联(OSI)国际标准。凡遵循国际标准所开发的硬件和软件,都能彼此兼容,可方便地实现互联。

    ●       多用户

    多用户是指系统资源可以被不同用户各自拥有和使用,即每个用户对自己的资源(例如:文件、设备)有特定的权限,互不影响。Linux继承了UNIX的多用户特性。

    ●       多任务

    多任务是现代计算机的最主要的一个特点。它是指计算机同时执行多个程序,而且各个程序的运行互相独立。Linux系统调度每一个进程,平等地访问微处理器。由于CPU的处理速度非常快,其结果是,启动的应用程序看起来好像在并行运行。事实上,从处理器执行一个应用程序中的一组指令到Linux调度微处理器再次运行这个程序之间只有很短的时间延迟,用户是感觉不出来的。

    ●       良好的用户界面

    Linux向用户提供了3种界面:传统操作界面、系统调用界面和图形用户界面。Linux的传统操作界面是基于文本的命令行界面,即Shell,它既可以联机使用,又可在文件上脱机使用。Shell有很强的程序设计能力,用户可方便地用它编制程序,从而为用户扩充系统功能提供了更高级的手段。可编程Shell是指将多条命令组合在一起,形成一个Shell程序,这个程序可以单独运行,也可以与其他程序同时运行。

    系统调用界面是为用户提供编程时使用的界面。用户可以在编程时直接使用系统提供的系统调用命令。系统通过这个界面为用户程序提供低级、高效率的服务。

    Linux还为用户提供了图形用户界面。它利用鼠标、菜单、窗口、滚动条等设施,给用户呈现一个直观、易操作、交互性强的友好的图形化界面。

    ●       设备独立性

    Linux是具有设备独立性的操作系统,它的内核具有高度的适应能力。随着越来越多的程序员开发Linux系统,将会有更多的硬件设备加入到各种Linux内核和发行版本中。另外,由于用户可以免费得到Linux的内核源代码,因此,用户可以根据需要修改内核源代码,以便适应新增加的外部设备。

    设备独立性是指操作系统把所有外部设备统一当作文件来看待,只要安装它们的驱动程序,任何用户都可以像使用文件一样,操纵、使用这些设备,而不必知道它们的具体存在形式。

    具有设备独立性的操作系统,通过把每一个外围设备看作一个独立文件来简化增加新设备的工作。当需要增加新设备时,系统管理员就在内核中增加必要的连接。这种连接(也称作设备驱动程序)能保证每次调用设备提供的服务时,内核能以相同的方式来处理它们。当新的或更好的外设被开发并交付给用户时,系统允许在这些设备连接到内核后,能不受限制地立即访问它们。设备独立性的关键在于内核的适应能力。其他操作系统只允许一定数量或一定种类的外部设备连接。而设备独立性的操作系统却能够容纳任意种类及任意数量的设备,因为每一个设备都是通过其与内核的专用连接进行独立访问的。

    ●       提供了丰富的网络功能

    完善的内置网络是Linux的一大特点。Linux在通信和网络功能方面优于其他操作系统。其他操作系统不包含如此紧密地和内核结合在一起的连接网络的能力,也没有内置这些联网特性的灵活性。而Linux为用户提供了完善的、强大的网络功能。

    支持Internet是其网络功能之一。Linux免费提供了大量支持Internet的软件,通过Internet,用户能用Linux与世界上各个地区的人方便地通信。它内建了http、ftp、dns等功能,支持所有常见的网络服务,包括ftp、telnet、NFS、TCP、IP等,加上超强的稳定性,因此很多ISP(Internet Service Providers)都是采用Linux来架设邮件服务器、FTP服务器及Web 服务器等各种服务器的。Linux在最新发展的内核中还包含了一些通用的网络协议,比如IPv4、IPv6、AX.25、X.25、IPX、DDP(Appletalk)、NetBEUI、Netrom 等。用户能通过一些Linux命令完成内部信息或文件的传输。 Linux不仅允许进行文件和程序的传输,它还为系统管理员和技术人员提供了访问其他系统的接口。

    另外,还可以进行远程访问。通过这种远程访问的功能,一位技术人员能够有效地为多个系统服务,即使那些系统位于相距很远的地方。稳定的核心中目前包含的网络协议有TCP、IPv4、IPX、DDP、AX等。另外还提供Netware的客户机和服务器,以及现在最热门的Samba(让用户共享Mircosoft Network资源)。

    ●       可靠的系统安全

    Linux采取了许多安全技术措施,包括对读/写进行权限控制、带保护的子系统、审计跟踪、核心授权等,这为网络多用户环境中的用户提供了必要的安全保障。

    ●       良好的可移植性

    可移植性是指将操作系统从一个平台转移到另一个平台上,并使它仍然能按其自身的方式运行的能力。

    Linux是一种可移植的操作系统,能够在从微型计算机到大型计算机的任何环境中运行。可移植性为运行Linux的不同计算机平台与其他任何计算机进行准确而有效的通信提供了手段,不需要另外增加特殊的和昂贵的通信接口。

    1.2 C语言的简介和特点

    C语言是贝尔实验室的Dennis Ritchie在B语言的基础上开发出来的,1972年在一台DEC PDP-11计算机上实现了最初的C语言。C语言是与硬件无关的,用C语言编写的程序能移植到大多数计算机上。C语言在各种计算机上的快速推广导致了许多C语言版本。这些版本虽然是类似的,但通常是不兼容的。为了明确定义与机器无关的C语言,1989年美国国家标准协会制定了C语言的标准(ANSI C)。在ANSI标准化后,C语言的标准在相当长的一段时间内都基本保持不变,尽管C++进行了改进(实际上,Normative Amendment1在1995年已经开发了一个新的C语言版本,但是这个版本很少为人所知)。ANSI标准在20世纪90年代又经历了一次比较大的改进,这就是ISO9899:1999(1999年出版)。这个版本就是通常提及的C99。它被ANSI于2000年2月采用。

    C 语言之所以发展迅速,而且成为最受欢迎的语言之一,主要是因为它具有强大的功能。许多著名的系统软件,如UNIX/Linux、Windows、DBASE Ⅲ PLUS、DBASE Ⅳ 都是由C 语言编写的。用C 语言加上一些汇编语言子程序,就更能显示C 语言的优势,像PC- DOS 、WORDSTAR等就是用这种方法编写的。

    归纳起来,C 语言具有下列特点:

    ●       中级语言。它把高级语言的基本结构和语句与低级语言的实用性结合起来。C 语言可以像汇编语言一样对位、字节和地址进行操作,而这三者是计算机最基本的工作单元。

    ●       结构式语言 。结构式语言的显著特点是代码及数据的模块化,即程序的各个部分除了必要的信息交流外彼此独立。这种结构化方式可使程序层次清晰,便于使用、维护以及调试。C 语言是以函数形式提供给用户的, 这些函数可方便地调用, 并采用多种循环、条件语句控制程序流向,从而使程序完全结构化。

    ●       功能齐全。C 语言具有各种各样的数据类型,并引入了指针概念,可使程序效率更高。另外,C 语言也具有强大的图形功能,支持多种显示器和驱动器。而且计算功能、逻辑判断功能也比较强大,可以实现决策目的。   

    ●       可与Linux无缝结合。Linux本身是使用C语言开发的,在Linux上用C语言作开发,效率很高。

    1.3 Linux程序设计基础知识

    对一个Linux开发人员来说,在使用一种编程语言编写程序以前,对操作系统中程序的保存位置有一个透彻的了解是很重要的。比如,应知道软件工具和开发资源保存在什么位置是很重要的。下面首先简单介绍Linux的几个重要的子目录和文件。

    这部分内容虽然是针对 Linux的,但同样也适用于其他类UNIX系统。

    1.3.1 程序安装目录

    Linux下的程序通常都保存在专门的目录里。系统软件可以在/usr/bin子目录里找到。系统管理员为某个特定的主机系统或本地网络添加的程序可以在/usr/local/bin子目录里找到。

    系统管理员一般都喜欢使用/usr/local子目录,因为它可以把供应商提供的文件和后来添加的程序以及系统本身提供的程序隔离开来。/usr子目录的这种布局方法在需要对操作系统进行升级的时候非常有用,因为只有/usr/local子目录里的东西需要保留。我们建议读者编译自己的程序时,按照/usr/local子目录的树状结构来安装和访问相应的文件。

    某些随后安装的软件都有它们自己的子目录结构,其执行程序也保存在特定的子目录里,最明显的例子就是 X窗口系统,它通常安装在一个名为/usr/X11R6的子目录里,XFree论坛组织发行的用于英特尔处理器芯片的各种XFree 86窗口系统变体也安装在这里。

    GNU的C语言编译器gcc(后面的程序设计示例中使用的就是它)通常安装在/usr/bin或者/usr/local/bin子目录里,但通过它运行的各种编译器支持程序一般都保存在另一个位置。这个位置是在用户使用自己的编译器时指定的,随主机类型的不同而不同。对 Linux系统来说,这个位置通常是/usr/lib/gcc-lib/目录下以其版本号确定的某个下级子目录。GN的C/C++编译器的各种编译程序以及GNU专用的头文件都保存在这里。

    1.3.2 头文件

    在使用C语言和其他语言进行程序设计的时候,我们需要头文件来提供对常数的定义和对系统及库函数调用的声明。对C语言来说,这些头文件几乎永远保存在/usr/include及其下级子目录里。那些赖于所运行的 UNIX或Linux操作系统特定版本的头文件一般可以在/usr/include/sys或/usr/include/linux子目录里找到。其他的程序设计软件也可以有一些预先定义好的声明文件,它们的保存位置可以被相应的编译器自动查找到。比如,X窗口系统的/usr/include/X1R6子目录和GNU C++编译器的/usr/include/g++ -2子目录等。

    在调用C语言编译器的时候,可以通过给出“ -I”编译命令标志来引用保存在下级子目录或者非标准位置的头文件,类似命令如下:

    [david@localhost linux]$ gcc -I /usr/openwin/include hello.c

    该命令会使编译器在/usr/openwin/include子目录和标准安装目录两个位置查找fred.c程序里包含的头文件。具体情况可以参考第3章。

    用grep命令来查找含有某些特定定义与函数声明的头文件是很方便的。假设想知道用来返回程序退出状态的文件的名字,可以使用如下方法:

    先进入/usr/include子目录,然后在grep命令里给出该名字的几个字母,如下所示:

    [david@localhost linux]$ grep KEYSPAN *.h

    pci_ids.h:#define PCI_SUBVENDOR_ID_KEYSPAN      0x11a9

    pci_ids.h:#define PCI_SUBDEVICE_ID_KEYSPAN_SX2 0x5334

    grep命令会在该子目录里所有名字以.h结尾的文件里查找字符串“KEYSPAN”。在上面的例子里,(从其他文件中间)可以查找到文件pci_ids.h。

    1.3.3 库文件

    库文件是一些预先编译好的函数的集合,那些函数都是按照可再使用的原则编写的。它们通常由一组互相关联的用来完成某项常见工作的函数构成。比如用来处理屏幕显示情况的函数(curses库)等。我们将在后续章节讲述这些函数库文件。

    标准的系统库文件一般保存在/lib或者/usr/lib子目录里。编译时要告诉 C语言编译器(更确切地说是链接程序)应去查找哪些库文件。默认情况下,它只会查找 C语言的标准库文件。这是从计算机速度还很慢、CPU价格还很昂贵的年代遗留下来的问题。在当时,把一个库文件放到标准化子目录里然后寄希望于编译器自己找到它是不实际的。库文件必须遵守一定的命名规则,还必须在命令行上明确地给出来。

    库文件的名字永远以lib这几个字母打头,随后是说明函数库情况的部分(比如用c表示这是一个 C语言库;而m表示这是一个数学运算库等)。文件名的最后部分以一个句点(.)开始,然后给出这个库文件的类型,如下所示:

    ●       .a 传统的静态型函数库。

    ●       .so和. sa 共享型函数库(见下面的解释)。

    函数库一般分为静态和共享两种格式,用ls /usr/lib命令查一下就能看到。在通知编译器查找某个库文件的时候,既可以给出其完整的路径名,也可以使用–l标志。详细内容可以参考第3章。

    1. 静态库

    函数库最简单的形式就是一组处于可以“拿来就用”状态下的二进制目标代码文件。当有程序需要用到函数库中的某个函数时,就会通过 include语句引用对此函数做出声明的头文件。编译器和链接程序负责把程序代码和库函数结合在一起成为一个独立的可执行程序。如果使用的不是标准的C语言运行库而是某个扩展库,就必须用–l选项指定它。 

    静态库也叫做档案(archive),它们的文件名按惯例都以. a结尾。比如 C语言标准库为/usr/lib/libc.a、X11库为/usr/X11R6/lib/libX11.a等。

    自己建立和维护静态库的工作并不困难,用ar(“建立档案”的意思)程序就可以做到,另外要注意的是,应该用gcc -c命令对函数分别进行编译。应该尽量把函数分别保存到不同的源代码文件里去。如果函数需要存取普通数据,可以把它们放到同一个源代码文件里并使用在其中声明为static类型的变量。

    2. 共享库

    静态库的缺点是,如果我们在同一时间运行多个程序而它们又都使用着来自同一个函数库里的函数时,内存里就会有许多份同一函数的备份,在程序文件本身也有许多份同样的备份。这会消耗大量宝贵的内存和硬盘空间。

    许多UNIX系统支持共享库,它同时克服了在这两方面的无谓消耗。对共享库和它们在不同系统上实现方法的详细讨论超出了本书的范围,所以我们把注意力集中在眼前 Linux环境下的实现方法上。

    共享库的存放位置和静态库是一样的,但有着不同的文件后缀。在一个典型的 Linux系统上,C语言标准库的共享版本是 /usr/lib/libc.so N,其中的N是主版本号。

    1.4 LinuxC语言编程环境概述

    Linux下C语言编程常用的编辑器是vim或emacs,编译器一般用gcc,编译链接程序用make,跟踪调试一般使用gdb,项目管理用makefile。下面先通过一个小程序来熟悉这些工具的基本应用。各个工具的详细使用方法将在后面的各个章节逐步讲解。

    (1) 要编辑C源程序,应首先打开vim或emacs编辑器,然后录入以下多段源代码。使用main函数调用mytool1_print、mytool2_print这两个函数。

     

     

    #include "mytool1.h"

    #include "mytool2.h"

     

    int main(int argc,char **argv)

    {

    mytool1_print("hello");

    mytool2_print("hello");

    }

    (2) 在mytool1.h中定义mytool1.c的头文件。

     

     

    /* mytool1.h */

    #ifndef_MYTOOL_1_H

    #define_MYTOOL_1_H

     

    void mytool1_print(char *print_str);

     

    #endif

    (3) 用mytool1.c实现一个简单的打印显示功能。

     

     

    /* mytool1.c */

    #include "mytool1.h"

    void mytool1_print(char *print_str)

    {

    printf("This is mytool1 print %s/n",print_str);

    }

    (4) 在mytool2.h中定义mytool2.c头文件。

     

     

    /* mytool2.h */

    #ifndef _MYTOOL_2_H

    #define _MYTOOL_2_H

     

    void mytool2_print(char *print_str);

     

    #endif

    (5) mytool2.c实现的功能与mytool1.c相似。

     

     

    /* mytool2.c */

    #include "mytool2.h"

    void mytool2_print(char *print_str)

    {

    printf("This is mytool2 print %s/n",print_str);

    }

    (6) 使用makefile文件进行项目管理。makefile文件内容如下。

     

     

    main:main.o mytool1.o mytool2.o

             gcc -o main main.o mytool1.o mytool2.o

             main.o:main.c mytool1.h mytool2.h

             gcc -c main.c

             mytool1.o:mytool1.c mytool1.h

             gcc -c mytool1.c

             mytool2.o:mytool2.c mytool2.h

             gcc -c mytool2.c

    (7) 将源程序文件和makefile文件保存在Linux下的同一个文件夹下,然后运行make编译链接程序如下:

    [david@localhost 1c]$ make

    [david@localhost 1c]$ ./main

    This is mytool1 print hello

    This is mytool2 print hello

    至此,这个小程序算是完成了,如果想跟踪调试可以参考第4章。

    1.5 Linux程序设计的特点

    在进行程序设计时首先应养成良好的程序设计风格。Linux操作系统的设计师们鼓励人们采用一种独到的程序设计风格。下面是Linux程序和系统所共有的一些特点。

    (1) 简单性。许多最有用的 Linux软件工具都是非常简单的,程序小而易于理解。

    (2) 重点性。一个所谓功能齐全的程序可能既不容易使用,也不容易维护。如果程序只用于一个目的,那么当更好的算法或更好的操作界面被开发出来的时候,它就更容易得到改进。在 Linux世界里,通常会在需求出现的时候把小的工具程序组合到一起来完成一项更大的任务,而不是用一个巨大的程序预测一个用户的需求。

    (3) 可反复性。使用的程序组件把应用程序的核心部分组建成一个库。带有简单而又灵活的程序设计接口并且文档齐备的函数库能够帮助其他人开发同类的项目,或者能够把这里的技巧用在新的应用领域。例如dbm数据库函数库就是一套由不同功能的函数组成的集合,而不是一个单一的数据库管理系统。

    (4) 过滤性。许多Linux应用程序可以用作过滤器,即它们可以把自己的输入转换为另外一种形式的输出。在后面将会讲到,Linux提供的工具程序能够将其他Linux程序组合成相当复杂的应用软件,其组合方法既新颖又奇特。当然,这类程序组合正是由Linux独特的开发方法支撑着的。

    (5) 开放性。文件格式比较成功和流行的 Linux程序所使用的配置文件和数据文件都是普通的 ASCII文本。如果在程序开发中遵循该原则,将是一种很好的做法。它使用户能够利用标准的软件工具对配置数据进行改动和搜索,从而开发出新的工具,并通过新的函数对数据文件进行处理。源代码交叉引用检查软件 ctags就是一个这样的好例子,它把程序中的符号位置信息以规则表达式的形式记录下来供检索程序使用。

    (6) 灵活性。因为你根本无法预测一个不太聪明的用户会怎样使用你的程序,因此在进行程序设计时,要尽可能地增加灵活性,尽量避免给数据域长度或者记录条数加上限制。同时如果可能,应尽量编写能够响应网络访问的程序,使它既能够跨网络运行又能够在本地单机上运行。

    1.6 LinuxC语言编码的风格

    Linux作为GN家族的一员,其源代码数以万计,而在阅读这些源代码时我们会发现,不同的源代码的美观程度和编程风格都不尽相同,例如下面的glibc代码:

    static voidrelease_libc_mem (void)

    {

    /*Only call the free function if we still are running in mtrace mode. */

    if (mallstream != NULL)

    __libc_freeres ();

    }

    或者Linux的核心代码:

    static int do_linuxrc(void * shell)

    static char *argv[] = { "linuxrc",NULL,};

    close(0);close(1);close(2);

    setsid();

    (void) open("/dev/console",O_RDWR,0);

    (void) dup(0);

    (void) dup(0);

    return execve(shell,argv,envp_init);

    }

    比较一下,上面的这些代码是否看起来让人赏心悦目?而有些程序员编写的程序由于没有很好的缩进及顺序,让人看起来直皱眉头。编写干净美观的代码,不仅仅使代码更容易阅读,还能使代码成为一件艺术品。与微软的匈牙利命名法一样,Linux上的编程主要有两种编程风格:GNU风格和Linux核心风格,下面将分别介绍。

    1.6.1 GNU编程风格

    下面是基于GNU的编程风格,编写代码时应遵循这些基本要求。

    ●       函数开头的左花括号放到最左边,避免把任何其他的左花括号、左括号或者左方括号放到最左边。

    à       尽力避免让两个不同优先级的操作符出现在相同的对齐方式中。

    à       每个程序都应该有一段简短地说明其功能的注释开头。例如:fmt - filter for simplefilling of text。

    ●       请为每个函数书写注释,以说明函数做了些什么,需要哪些种类的参数,参数可能值的含义以及用途。

    à       不要在声明多个变量时跨行。在每一行中都以一个新的声明开头。

    à       当在一个if语句中嵌套了另一个if-else语句时,应用花括号把if-else括起来。

    ●       要在同一个声明中同时说明结构标识和变量,或者结构标识和类型定义(typedef)。

    à       尽力避免在if的条件中进行赋值。

    à       请在名字中使用下划线以分隔单词,尽量使用小写; 把大写字母留给宏和枚举常量,以及根据统一的惯例使用的前缀。

    à       命令一个命令行选项时,给出的变量应该在选项含义的说明之后,而不是选项字符之后。

    1.6.2 Linux 内核编程风格

    下面是 Linux 内核所要求的编程风格:

    ●       注意缩进格式。

    ●       将开始的大括号放在一行的最后,而将结束大括号放在一行的第一位。

    ●       命名系统。变量命名尽量使用简短的名字。

    ●       函数最好要短小精悍,一个函数最好只作一件事情。

    ●       注释。注释说明代码的功能,而不是说明其实现原理。

    看了上面两种风格的介绍,读者是不是觉得有些太多了,难以记住?不要紧,Linux有很多工具来帮助我们。除了vim和emacs以外,还有一个非常有意思的小工具 indent可以帮我们美化C/C++源代码。

    下面用这条命令将Linux 内核编程风格的程序quan.c转变为 GNU编程风格,代码如下:

    [david@localhost ~]$ indent -gnu quan.c

    利用indent这个工具,大家就可以方便地写出漂亮的代码来。

     

     

     

     

     

     

    第2章 vi与emacs编辑器

    从本章开始,我们将进入Linux充满挑战的C语言编程世界,首先介绍的是文本编辑器。

    文本编辑器可以说是计算机最基本的应用,修改设置文件、编写程序或者建立文件都需要用到它。Linux提供了齐全的文本编辑器,可以让用户按照自己的喜好进行选择。本章主要介绍vim、emacs等编辑器,对Linux其他的编辑器也稍作介绍。通过本章的学习,可以对Linux下的编辑器有一个深入的了解,为今后编程打下良好基础。

    2.1 vim概述及应用

    vim(vi improve)可以说是Linux中功能最为强大的编辑器,它是由UNIX系统下的传统文本编辑器vi发展而来的。下面首先介绍一下vi。

    vi是个可视化的编辑器(vi就意味着可视化——visual)。 那么,什么是可视化的编辑器呢?可视化的编辑器就是可以在编辑文本的时候看到它们。非可视化的编辑器的例子可以举出不少,如ed、sed和edlin(它是DOS自带的最后一个编辑器) 等。vi成为BSD UNIX的一部分,后来AT&T也开始用vi,于是标准UNIX也开始 用vi。Linux下的vim是vi的一个增强版本,有彩色和高亮等特性,对编程有很大的帮助。

    1. 启动与退出vim

    由于vim的功能很多,首先来看如何启动和退出vim。

    (1) 在Linux提示符下键入vim(或使用vim myfile来编辑已经存在的文件)即可启动它。

    (2) 要退出vim,先按下Esc键回到命令行模式,然后键入“:”,此时光标会停留在最下面一行,再键入“q”,最后按下Enter键即可,见图2-1。

    技巧:

    在X-Window下也可以通过在“开始”菜单里找到“编程”︱Vi I Mproved来运行X-Window下的vim。此时其界面如图2-2所示。

    图2-1 退出vim

    图2-2 X-Window下的vim界面

    2. 命令行模式的操作

    命令行模式提供了相当多的按键及组合按键来执行命令,帮助用户编辑文件。由于这些命令相当多,在此仅作简单介绍。

    (1) 移动光标

    在命令行模式和插入模式下,都可以使用上、下、左、右4个方向键来移动光标的位置。但是有些情况下,如使用telnet远程登陆时,方向键就不能用,必须用命令行模式下的光标移动命令。这些命令及作用见表2-1。

     

    表2-1 常用的移动光标的命令

    命    令

    操 作 说 明

    h

    将光标向左移动一格

    l

    将光标向右移动一格

    j

    将光标向上移动一格

    k

    将光标向下移动一格

    0

    将光标移动到该行的最前面

    $

    将光移动到该行的最后面

    G

    将光标移动到最后一行的开头

    W或w

    将光标移动到下一个字

    e

    将光标移动到本单词的最后一个字符。如果光标所在的位置为本单词的最后一个字符,则跳动到下一个单字的最后一个字符。标点符号如“.”、“,”或“/”等字符都会被当成一个字

    b

    将光标移动到单词的最后一个字符,如果光标所在位置为本单词的第一个字符,则跳到上一个单词的第一个字符

    {

    将光标移动到前面的“{”处。在C语言编程时,如果按两次就会找到函数开头“{”处,如果再次连续按两次还可以找到上一个函数的开头处

    }

    同“{”的使用,将光标移动到后面的“}”

    Ctrl+b

    如果想要翻看文章的前后,可以使用Page Down和Page Up;但当这两个键不能使用时,可以使用Ctrl+b将光标向前卷一页,相当于Page Up

    Ctrl+f

    将光标向后卷一页,相当于Page Down

    Ctrl+u

    将光标向前移半页

    Ctrl+d

    将光标向后移半页

    Ctrl+e

    将光标向下卷一行

    Ctrl+y

    将光标向后卷一行

    N+/

    将光标移至第n行(n为数字)

    (2) 复制文本

    复制文本可以节省重复输入的时间,vim也提供了以下的操作命令,见表2-2。

    表2-2 常用的复制文本的命令

    命    令

    操 作 说 明

    y+y

    将光标目前所在的位置整行复制

    y+w

    复制光标所在的位置到整个单词所在的位置

    n+y+w

    若输入3yw,则会将光标所在位置到单词结束以及后面两个单词(共3个单词)一起复制

    n+y+y

    若按3yy,则将连同光标所在位置的一行与下面两行一起复制

    p

    将复制的内容粘贴光标所在的位置。若复制的是整行文本,则会将整行内容粘贴到光标所在的位置

    (3) 删除文本

    删除文本命令一次可删除一个字符,也可以一次删除好几个字符或是整行文本,见表2-3。

    表2-3 常用的删除文本的命令

    命    令

    操 作 说 明

    d+左方向键

    连续按d和左方向键,将光标所在位置前一个字符删除

    d+右方向键

    将光标所在位置字符删除

    d+上方向键

    将光标所在位置行与其上一行同时删除

    d+下方向键

    将光标所在位置行与下一行同时删除

    d+d

    连按两次d,可将光标所在的行删除,若是连续删除,可以按住d不放

    d+w

    删除光标所在位置的单词,若是光标在两个字之间,则删除光标后面的一个字符

    n+d+d

    删除包括光标所在行及向下的n行(n为数字)

    n+d+上方向键

    删除包括光标所在行及向上的n行

    n+d+下方向键

    同n+d+d命令

    D

    将光标所在行后所有的单词删除

    x

    将光标所在位置的字符删除

    X

    将光标所在位置前一个字符删除

    n+x

    删除光标所在位置及其后的n个字符

    n+X

    删除光标所在位置及其前的n个字符

     

    (4) 找出行数及其他按键

    当我们编写程序时,常常需要跳到某一行去修改,因此每一行的行号就相当重要。vim为此提供的命令见表2-4。

    表2-4 常用的找出行数的命令

    命    令

    操 作 说 明

    Ctrl+g

    在最后一行中显示光标所在位置的行数及文章的总行数

    nG

    将光标移至n行(n为数字)

    r  

    修改光标所在字符

    R

    修改光标所在位置的字符,可以一直替换字符,直到按下ESC键

    u

    表示复原功能

    U

    取消对行所做的所有改变

    .

    重复执行上一命令

    Z+Z

    连续两次输入z,表示保存文件并退出vi

    %

    符号匹配功能,在编辑时,如果输入“%(”,系统将会自动匹配相应的“)”

    3. 命令行模式切换到输入模式

    进入vim时,默认的模式是命令行模式,而要进入输入模式输入数据时,可以用下列按键:

    ●       按“a”键 从目前光标所在位置的下一个字符开始输入。

    ●       按“i”键 从光标所在位置开始插入新输入的字符。

    ●       按“o”键 新增加一行,并将光标移到下一行的开头。

    4. 最后行模式的操作

    vim的最后行模式是指可以在界面最底部的一行显示的输入命令,一般用来执行查找特定的字符串、保存及退出等任务。在命令行模式下输入冒号“:”,就可以进入最后行模式了,还可以使用“?”和“/”键进入最后行模式。比起命令行模式的诸多操作命令,最后行模式的操作命令就少多了,见表2-5。

    表2-5 最后行模式主要的操作命令

    命    令

    操 作 说 明

    e

    在vi中编辑时,可以使用e创建新的文件

    n

    加载新文件

    w

    写文件,也就是将编辑的内容保存到文件系统中。vim在编辑文件时,先将编辑内容保存在临时文件中,如果没有执行写操作直接退出的话,修改内容并没有保存到文件中

    w!

    如果想写只读文件,可以使用w!强制写入文件

    q!

    表示退出vim,但是文件内容有修改的话,系统会提示要先保存,如果不保存退出,需要使用命令q!强制退出

    set nu

    set可以设置vim 的某些特性,这里是设置每行开头提示行数。想取消设置,使用命令set none

    /

    查找匹配字符串功能。在编辑时,想查找包含某一个字符串,可以用“/字符串”自动查找,系统会突出显示所有找到的字符串,并转到找到的第一个字符串。如果想继续向下查找,可以按n键;向前继续查找则按N键

    也可以使用“?字符串”查找特定字符串,它的使用与“/”相似,但它是向前查找字符串

     

    5. vim的注意事项

    由于Linux系统的vim编辑器是从UNIX下的vi发展而来的,而UNIX下的vi编辑器是从行编辑器ed发展而来的。因此,vim不如目前流行的微软推出的同类编辑器易用、直观,但是它的强大功能却是微软同类产品无法比拟的。因此一些人学习时可能会感到有一些不便和困惑。针对这类问题,这里列出了使用vim中应注意的一些事项。当然要熟练使用vim,还需要平时操作中不断地提高和积累。

    ●       插入编辑方式和命令方式切换时出现混乱

    这种情况产生的原因通常是:还未输入插入命令便开始进行文本输入,从而无法在正确位置输入文本;另外,当插入信息后,还未按Esc键结束插入方式,就又输入其他的命令信息,从而使命令无法执行。

    当出现这种情况时,首先要确定自己所处的操作方式,然后再确定下一步做什么工作。若不易搞清楚当前所处的状态,还可以使用Esc键退回到命令方式重新进行输入。

    ●       在进行文档编辑时,vim编辑器会产生混乱

    这种状态的产生往往是由于屏幕刷新有误,此时可以使用Ctrl+l键对屏幕进行刷新,如果是在终端,可以用Ctrl+r进行屏幕刷新。

    ●       对屏幕中显示的信息进行操作时,系统没有反应。

     出现这种情况可能是由于屏幕的多个进程被挂起(如不慎用了Ctrl+s键等),此时可用Ctrl+q进行解脱,然后重新进行输入。

    ●       当编辑完成后,不能正确退出vim

    出现这种情况的原因可能是系统出现了意外情况。如:文件属性为只读、用户对编辑的文件没有写的权限。如果强行执行退出命令“:w!”仍无法退出,可以用“:w newfile”命令将文件重新存盘后再退出,以减少工作中的损失,这个新文件newfile应是用户有写权限的文件。

    如果暂时没有可以使用的文件,可以借用/tmp目录建一个新的文件。因为Linux系统中的/tmp是一个临时目录,系统启动时总要刷新该目录,因此操作系统一般情况下不对此目录下进行保护。但当处理完成后,切记应将新文件进行转储,否则依然会造成信息损失。

    ●       在使用vim时,万一发生了系统掉电或者突然当机的情况怎么办?

    工作时发生了掉电和当机,对正做的工作无疑是一种损失,但是vim程序可使损失降到最小。因为,对vim的操作实际上是对编辑缓冲区的数据操作,而系统经常会将缓冲区的内容自动进行保存。因此,当机后用户可以在下次登陆系统后使用-r选项进入vi,将系统中最后保存的内容恢复出来。例如,在编辑cd文件的时候突然断电或者系统崩溃后的恢复命令为:

    [david@DAVID david]$ vi cd -r

    vim的学习应侧重于实际的应用,在了解vim的使用规则后应该多上机操作,不断积累经验,逐步地使自己成为vi编辑能手。

    2.2 emacs简介及应用

    emacs编辑器是一款自由软件产品,在Linux系统中比较流行。emacs的涵义是宏编辑器(macro editor)。emacs最开始是由richard stallman编写的,他的初衷是将emacs设计成一个Linux的shell,同时还增加了一些现代操作系统应支持的用户环境(比如,mail的收发、web的查询、新闻阅读、日志功能等)。另外,在emacs中还包括了list语言的解释执行功能。

    emacs的一个缺点是它占用的磁盘空间比较大,因此为了支持用户的使用,emacs提供多种模式以适用于不同的用户需求。进行安装时,可根据选项设置指定的模式,以减少磁盘的使用量。

    1. emacs的启动和退出

    emacs中包含的命令很多,对于初学者来说有一些困难,但是一旦适应了它的使用方法,就会感到它的方便和灵活。

    在文本模式下要进入emacs,只要键入emacs即可:

    [david@DAVID david]$ emacs

    或者键入emacs [filename]来编辑文件:

    [david@DAVID david]$ emacs [filename]

    启动emacs后,看到的是emacs的基本情况描述信息。

    File Edit Options Buffers Tools Help

    Welcome to GNU Emacs, one component of a Linux-based GNU system.

     

    Get help                       C-h (Hold down CTRL and press h)

    Undo changes         C-x u       Exit Emacs                             C-x C-c

    Get a tutorial             C-h t       Use Info to read docs    C-h i

    Ordering manuals                   C-h RET

    Activate menubar F10 or ESC ' or   M-'

    ('C-' means use the CTRL key. 'M-' means use the Meta (or Alt) key.

    If you have no Meta key, you may instead type ESC followed by the

    character.)

     

    GNU Emacs 21.2.1 (i386-redhat-Linux-gnu, X toolkit, Xaw3d scroll bars)

     of 2003-02-20 on porky.devel.redhat.com

    Copyright (C) 2001 Free Software Foundation, Inc.

     

    GNU Emacs comes with ABSOLUTELY NO WARRANTY; type C-h C-w for full details.

    Emacs is Free Software--Free as in Freedom--so you can redistribute

    copies

    of Emacs and modify it; type C-h C-c to see the conditions.

    Type C-h C-d for information on getting the latest version.

     

    -uuu:---F1 *scratch* (Lisp Interaction)--L1--All--------

    [35dFor information about the GNU Project and its goals, type C-h C-p.

     

    提示:

    要退出 emacs,只要键入Ctrl+x或Ctrl+c即可。 即先按住键盘上的 Ctrl 键不放,再按下英文字母x或c 即可。当然启动或退出 emacs 的方法还有多种,将在以下各小节中陆续介绍。

    技巧:

    在X-Window下也可以通过在“开始”菜单里找到“编程”︱emacs来运行X-Window下的emacs,见图2-3。

    图2-3 X-Window下的emacs

    2. 文本编辑

    在emacs中的文本编辑的方式与vim的编辑方式有很大的区别,现在只简单介绍一些常用操作。

    (1) 删除文本

    ●       删除光标左侧的字符:按Delete键可删除光标左侧的字符。

    ●       删除光标所在的字符:按Ctrl+d键可删除光标所在的字符。

    ●       删除光标左侧单词:按Alt+Delete键可删除光标左侧的单词。

    ●       删除光标右侧单词:按Alt+d键可以删除光标右侧的单词。

    ●       删除至行尾:按Ctrl+k键可以从光标处开始删除至尾行。

    ●       删除多行:不要移动光标,连续在同一位置按Ctrl+k键。

    ●       删除一个句子:按Alt+k从光标处开始删到句子尾。

    (2) 行的分割、合并与新增

    ●       分割一行:在要分割处按下Enter键。

    ●       合并两行:在行尾处按Ctrl+d或于次行首按Delete。

    ●       新增空白行:按Ctrl+e将光标移至尾行再按下Enter键。

    (3) 命令的复原与取消

    ●       复原上一个命令:按下Ctrl+x u、Ctrl +/或Ctrl+_ (同时按下Ctrl+Shift+_3个键),可以恢复到上一个命令。

    ●       取消目前再执行的命令:按Ctrl+g可以取消目前正在执行的命令,按错命令时可用此按键取消。

    (4) 剪切与粘贴

    在了解剪切(cut)与粘贴文本的按键操作前,先了解一下删除与剪切命令的区别。

    ●       删除:凡是一次只删除一个字符的按键命令多属于删除命令,如上述的Delete、Ctrl+d、Alt+Delete与Alt+d等按键。使用这些按键所删除的字符无法被恢复。

    ●       剪切:剪切命令可以将选择的内容复制到粘贴板上,并将原文中的内容删除。上面提到的Ctrl+k、Alt+k等按键就是剪切命令。

    ●       粘贴:按Ctrl+y会将当前粘贴板上的内容复制到光标所在位置。

    (5) 复制文本与区块

    ●       复制文本:先剪切,再粘贴。可以在选择完内容后按Ctrl+k剪切文本,再按Ctrl+y复制文本。

    ●       复制区块:在一个地方(A)按下Ctrl+Spase或Ctrl+@ (Ctrl+Shift+2)使它成为一个表示点,将光标移至另一处(B),再按下Alt+w,可将A与B之间的文本复制到系统的内存中,稍后可用粘贴命令将它们粘贴回来。

    3. 查找与替换

    (1) 一般查找

    在emacs中可用Ctrl+s及Ctrl+r两组命令进行渐进式查找。其中Ctrl+s会从光标所在的位置向文件尾方向查找,而Ctrl+r则是从光标所在的位置向文件头的方向查找。

    按下Ctrl+s或Ctrl+r后,响应区会出现:

    -search:

    或者出现

    -search backward:

    可以在响应区输入要查找的文本,并按Enter键,光标便会移至符合查找条件的字符串位置,此时可以继续按Ctrl+s键,将光标移至下一个符合查找条件的字符串,或按Ctrl+r键,将光标移至上一个符合条件的字符串。

     

    如果查找失败,就会出现如下的信息:

    Failing I-search: sdfsdfsdfsdfsdfsdfsd

    (2) 替换全部字符串

    使用此功能,可将光标后所有的匹配字符串一次性替换掉,系统并不会询问用户来进行确认,因此使用时要特别小心。操作过程如下:

    按Alt+x键,并于响应区输入“replace-string”(实际输入时要使用替换文本),即可开始字符串的替换。在提示符后面输入原始的字符串,并按Enter键,再在提示符后输入替换后的新字符串,即可替换光标后所有匹配的字符串。

    (3) 选择性替换

    选择性替换就是在替换时询问一下用户的意见,然后根据指示来决定是否替换。操作过程如下:

    按下Alt+x键,于响应区输入“query-replace”,即可进行选择性替换,并在提示符后输入原始字符串,按Enter键,再提示输入替换后的新字符串。此时如果系统发现可替换的字符串,可按Enter键进行替换、按n键跳至下一个匹配的字符串,或按q键中止替换操作。操作的更详细说明可按F1键获得。

    2.3 Linux下的其他编辑器

    前两节介绍的vim和emacs都是Linux下的最常用的编辑器,尽管功能强大,但是操作也比较复杂,本节介绍两款操作简单的编辑器,即ed和pico。

    2.3.1 最简单的文本编辑器ed

    ed可以说是Linux下功能最简单的编辑器。ed一次仅能编辑一行,而非以全屏的方式来操作。

    要进入ed编辑环境,只需要在命令行输入ed即可:

    [david@DAVID david]$ ed

    ed有两种模式,分别是命令行模式与输入模式。当第一次执行ed时,进入的是ed的命令行模式,此模式下只能执行一些命令。由于进入ed后没有任何的说明文本,如果输入的命令不正确,则会出现问号“?”。如下代码所示,表示ed无法确认当前的操作,此时应重新输入正确命令。

    [david@DAVID david]$ ed

    david

    ?

    Linux

    ?

    1. 输入文本

    由于命令行模式仅能输入命令,因此要开始编辑文件内容,必须转到输入模式。进入编辑模式有3种方式,见表2-6。

    表2-6 输入模式下3种输入方式

    命    令

    操 作 说 明

    A

    将新输入的内容接在最后一行后面

    i

    将新输入的内容加到最后输入的一行的前一行

    c

    将新输入的内容替换原来的最后一行

     

    下面是三个命令的应用实例。

     a命令应用实例:

    [david@DAVID david]$ ed

    a

    i am david

    i'm a Linuxer

     i命令应用实例:

    [david@DAVID david]$ ed

    a

    i am david

    .

    i

    i am a Linuxer

    c命令应用实例:

    [david@DAVID david]$ ed

    a

    i am david

    .

    c

    i am david

    如果想编辑一个已经存在的文件(比如david.txt),则可用下面的方式来执行ed:

    [david@DAVID david]$ ed david.txt

    11

    提示:

    ed无法让用户一次看到全部的内容,但是可以在命令行模式下看到最后输入的一行,例如:

    [david@DAVID david]$ ed david.txt

    11

    .

    i am david

    2. 插入一行

    若输入内容后,想在前面插入一行,则可输入i:

    [david@DAVID david]$ ed

    a

    i am david

    i am a Linuxer

    .

    i

    i love xueer    这一行将插入到“i am a Linuxer”之前

    3. 存盘和退出

    当建立文件时或完成编辑后,可以随时在命令行模式输入“w”保存文件,而要退出则输入“q”即可:

    [david@DAVID david]$ ed

    a

    i am david

    i am a Linuxer

    .

    i

    i love xueer

    .

    w xueer.txt   将文件保存为xueer.txt。如果是编辑已有的文件,则输入“w”即可

    47

    q             退出ed

    [david@DAVID david]$   回到Linux提示符下

    以上对Linux下的ed作了简单的介绍,虽然ed的功能不是太强,但当我们只需建立一个简单的文件时,也不失为一个相当方便的工具。

    2.3.2 最容易上手的编辑器pico

    如果觉得vim和emacs太难学,而ed功能又太简单,那么不妨试试pico。pico的使用界面有点像DOS下的PE2,即使是第一次使用的人也能够很快熟悉这种操作方式。这是Linux下最容易使用的入门级文本编辑器。

    1. pico的编辑环境

    可以在Linux提示符下执行pico(或者执行pico filename 加载一个文件)来启动它:

    UW PICO(tm) 4.2                New Buffer

     

    ^G Get Help ^O WriteOut ^R Read File ^Y Prev Pg ^K Cut Text ^C Cur Pos

    ^X Exit ^J Justify ^W Where is ^V Next Pg ^U UnCut Text^T To Spell

    pico不像其他编辑器那样有命令行模式与输入模式之分,用户可以直接在编辑区输入文本。按Enter键可换行,按空格键可将光标向右移动。当要删除字符时,将光标移动到该字符的右边,然后按Backspace键即可删除(按Delete键无效)。

    2. pico的操作按键

    在pico编辑环境的下方,有两排共12组操作按键,这些只是最常用的部分,其他比较少用的操作按键没有列出来。下面分别详述其功能。

    (1) 显示辅助功能—— Ctrl+G

    按Ctrl+G出现pico的帮助文档,再按Ctrl+V显示下一页,里面会列出所有的操作按键(除了这里介绍的12个之外,还有约12个操作按键,试试看)。

    UW PICO(tm) 4.2                New Buffer

     

    Pico is designed to be a simple, easy-to-use text editor with a

    layout very similar to the pine mailer. The status line at the

    top of the display shows pico's version, the current file being

    edited and whether or not there are outstanding modifications

    that have not been saved. The third line from the bottom is used

    to report informational messages and for additional command input.

    The bottom two lines list the available editing commands.

     

    Each character typed is automatically inserted into the buffer

    at the current cursor position. Editing commands and cursor

    movement (besides arrow keys) are given to pico by typing

    special control-key sequences. A caret, '^', is used to denote

    the control key, sometimes marked "CTRL", so the CTRL-q key

    combination is written as ^Q.

     

    The following functions are available in pico (where applicable,

    corresponding function key commands are in parentheses).

     

    ^G (F1)   Display this help text.

     

    ^F        move Forward a character.

    ^B        move Backward a character.

    ^P        move to the Previous line.

    ^N        move to the Next line.

    ^A        move to the beginning of the current line.

    ^E        move to the End of the current line.

    ^V (F8)   move forward a page of text.

    ^Y (F7)   move backward a page of text.

                        [ Unknown Command. ]

     

    ^X Exit Help                           ^V Next Pg

    (2) 保存文件——Ctrl+O

    按Ctrl+O后,操作会变成下面这个样子:

    File Name to write : LINUX.TXT 输入文件名后按Enter键即可

    ^G Get Help ^T To Files

    ^C Cancel    TAB Complete

    注意:

    此处出现的几个操作按键,其中Ctrl+C显示当前内容对应的帮助文档,与Ctrl+G不同,Ctrl+C表示不保存内容而返回到原来的编辑环境。Ctrl+T会显示目录,由用户选择要保存为哪一个文件。TAB则会帮用户添上完整的文件名称。

    (3) 插入文件——Ctrl+R

    按Ctrl+R可以在文件中插入一个文本文件的内容。

    File to insert from home directory: /home/david/david.txt 此处输入要插

    入的文件的名称

    ^G Get Help ^T To Files

    ^C Cancel

    (4) 滚动页面Ctrl+Y、Ctrl+C

    按Ctrl+Y可切换到前一页,如同按下PageUp; 按Ctrl+Y 可以切换到下一页,如同按下PageDown。

    (5) 剪切和粘贴整行文本——Ctrl+K、Ctrl+U

    当要剪切整行文本时,可将光标移动到要剪切的那一行,然后按Ctrl+K。当剪切之后在其他位置粘贴的时候,则将光标移动到粘贴的位置的下一行,再按Ctrl+U。用户也可以连续按3次 Ctrl+K 剪切3行(中间不可以有其他按键),再将光标移动到要粘贴的位置,然后按Ctrl+U。如单独使用Ctrl+K,就如同删除整行的操作按键。

    (6) 自动调整文本的对齐——Ctrl+J、Ctrl+U

    在输入文本的时候,可能没有注意到文本排列的美观,而造成每一行有长有短参差不齐的情况:

    UW PICO(tm) 4.2   New Buffer                       Modified

     

    hello david

    i love Linux

    i am a liuxer how are you i am fine and you

    此时若将光标放到调整的段落中,然后按下Ctrl+J,则整段文本会重新对齐,如下所示:

    UW PICO(tm) 4.2     New Buffer                         Modified

     

    hello david i love Linux i am a liuxer how are you i am fine and you

    每一次Ctrl+J只对一个段落起作用,如果觉得pico对齐的样子还比不上原来的好看,此时不要移动光标(只要一移动就不能恢复了),接着按Ctrl+Uj即可恢复。

    (7) 查找字符串——Ctrl+W

    若要在文章中查找某一个字符串,按Ctrl+W。

    Search : Linux

    ^G Get Help ^Y First Line ^T LineNumber^O End of Par

    ^C Cancel    ^V Last Line ^W Start of P

    (8) 显示目前光标的位置——Ctrl+C

    在pico中不能显示行号,因此我们可能会不知道目前光标所在的位置,但是只要按Ctrl+C,就会显示光标在全部行数中的第几行了。

    (9) pico还可以按Ctrl+T检查拼写错误

    UW PICO(tm) 4.2     New Buffer                       Modified

     

    hello david

    i love Linux

    i am a liuxer how are you i am fine and you

     

     

    Edit a replacement: david

    ^G Get Help

    ^C Cancel

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    第3章 gcc 编译器

    Linux的各发行版中包含了很多软件开发工具,它们中的很多是用于C和C++应用程序开发的。本章将介绍如何使用Linux下的C 编译器和其他C编程工具。

    3.1 gcc 简 介

    在为Linux开发应用程序时,绝大多数情况下使用的都是C语言,因此几乎每一位Linux程序员面临的首要问题都是如何灵活运用C编译器。目前Linux下最常用的C语言编译器是gcc(GNU Compiler Collection),它是GNU项目中符合ANSI C标准的编译系统,能够编译用C、C++和Object C等语言编写的程序。gcc不仅功能十分强大,结构也异常灵活。最值得称道的一点就是它可以通过不同的前端模块来支持各种语言,如Java、Fortran、Pascal、Modula-3和Ada等。gcc是可以在多种硬体平台上编译出可执行程序的超级编译器,其执行效率与一般的编译器相比,平均效率要高20%~30%。gcc支持编译的一些源文件的后缀及其解释见表3-1。

    表3-1 gcc所支持的语言

    后 缀 名

    所支持的语言

    .c

    C原始程序

    .C

    C++原始程序

    .cc

    C++原始程序

    .cxx

    C++原始程序

    .m

    Objective-C原始程序

    .i

    已经过预处理的C原始程序

    .ii

    已经过预处理的C++原始程序

    .s

    组合语言原始程序

    .S

    组合语言原始程序

    .h

    预处理文件(标头文件)

    .o

    目标文件

    .a

    存档文件

     

    开放、自由和灵活是Linux的魅力所在,而这一点在gcc上的体现就是程序员通过它能够更好地控制整个编译过程。

    在使用gcc编译程序时,编译过程可以细分为4个阶段:

    ●       预处理(Pre-Processing)

    ●       编译(Compiling)

    ●       汇编(Assembling)

    ●       链接(Linking)

    Linux程序员可以根据自己的需要让gcc在编译的任何阶段结束,检查或使用编译器在该阶段的输出信息,或者对最后生成的二进制文件进行控制,以便通过加入不同数量和种类的调试代码来为今后的调试做好准备。与其他常用的编译器一样,gcc也提供了灵活而强大的代码优化功能,利用它可以生成执行效率更高的代码。

    gcc提供了30多条警告信息和3个警告级别,使用它们有助于增强程序的稳定性和可移植性。此外,gcc还对标准的C和C++语言进行了大量的扩展,提高了程序的执行效率,有助于编译器进行代码优化,能够减轻编程的工作量。

    3.2 使 用 gcc

    gcc的版本可以使用如下gcc –v命令查看:

    [david@DAVID david]$ gcc -v

    Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/3.2.2/specs

    Configured with: ../configure --prefix=/usr --mandir=/usr/share/man

    --infodir=/

    sr/share/info --enable-shared --enable-threads=posix

    --disable-checking --with-

    ystem-zlib --enable-__cxa_atexit --host=i386-redhat-linux

    Thread model: posix

    gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)

    以上显示的就是Redhat linux 9.0里自带的gcc的版本3.2.2。

    下面将以一个实例来说明如何使用gcc编译器。例3-1能够帮助大家迅速理解gcc的工作原理,并将其立即运用到实际的项目开发中去。

    实例3-1 hello.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

     

     

    #include <stdio.h>

    int main (int argc,char **argv) {

    printf("Hello Linux/n");

    }

    要编译这个程序,只要在命令行下执行如下命令:

    [david@DAVID david]$ gcc hello.c -o hello

    [david@DAVID david]$ ./hello

    Hello Linux

    这样,gcc 编译器会生成一个名为hello的可执行文件,然后执行./hello就可以看到程序的输出结果了。

    命令行中 gcc表示用gcc来编译源程序,-o 选项表示要求编译器输出的可执行文件名为hello ,而hello.c是源程序文件。从程序员的角度看,只需简单地执行一条gcc命令就可以了;但从编译器的角度来看,却需要完成一系列非常繁杂的工作。首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。

    为了更好地理解gcc的工作过程,可以把上述编译过程分成几个步骤单独进行,并观察每步的运行结果。

    第一步要进行预编译,使用-E参数可以让gcc在预处理结束后停止编译过程:

    [david@DAVID david]$ gcc -E hello.c -o hello.i

    此时若查看hello.i文件中的内容,会发现stdio.h的内容确实都插到文件里去了,而且被预处理的宏定义也都作了相应的处理。

    # 1 "hello.c"

    # 1 "<built-in>"

    # 1 "<command line>"

    # 1 "hello.c"

    # 1 "/usr/include/stdio.h" 1 3

    # 28 "/usr/include/stdio.h" 3

    # 1 "/usr/include/features.h" 1 3

    # 291 "/usr/include/features.h" 3

    # 1 "/usr/include/sys/cdefs.h" 1 3

    # 292 "/usr/include/features.h" 2 3

    # 314 "/usr/include/features.h" 3

    # 1 "/usr/include/gnu/stubs.h" 1 3

    # 315 "/usr/include/features.h" 2 3

    # 29 "/usr/include/stdio.h" 2 3

    # 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

    # 213 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 3

    typedef unsigned int size_t;

    # 35 "/usr/include/stdio.h" 2 3

    # 1 "/usr/include/bits/types.h" 1 3

    # 28 "/usr/include/bits/types.h" 3

    # 1 "/usr/include/bits/wordsize.h" 1 3

    # 29 "/usr/include/bits/types.h" 2 3

    # 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

    # 32 "/usr/include/bits/types.h" 2 3

     

    "hello.i" 838L, 16453C                         1,1           Top

    下一步是将hello.i编译为目标代码,这可以通过使用-c参数来完成:

    [david@DAVID david]$ gcc -c hello.i -o hello.o

    gcc默认将.i文件看成是预处理后的C语言源代码,因此上述命令将自动跳过预处理步骤而开始执行编译过程,也可以使用-x参数让gcc从指定的步骤开始编译。最后一步是将生成的目标文件链接成可执行文件:

    [david@DAVID david]$ gcc hello.o -o hello

    在采用模块化的设计思想进行软件开发时,通常整个程序是由多个源文件组成的,相应地就形成了多个编译单元,使用gcc能够很好地管理这些编译单元。假设有一个由david.c和xueer.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序davidxueer,可以使用下面这条命令:

    [david@DAVID david]$ gcc david.c xueer.c -o davidxueer

    如果同时处理的文件不止一个,gcc仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下3条命令:

    [david@DAVID david]$ gcc david.c -o david.o

    [david@DAVID david]$ gcc xueer.c -o xueer.o

    [david@DAVID david]$ gcc david.o xueer.o -o davidxueer

    在编译一个包含许多源文件的工程时,若只用一条gcc命令来完成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含10 000行代码,如果像上面那样仅用一条gcc命令来完成编译工作,那么gcc需要将每个源文件都重新编译一遍,然后再全部链接起来。很显然,这样浪费的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这个问题,关键是要灵活运用gcc,同时还要借助像make这样的工具。关于make,将在第5章作详细的介绍。

    3.3 gcc警告提示功能

    gcc包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员尽快找到错误代码,从而写出更加专业和优美的代码。先来读读例3-2所示的程序,这段代码写得很糟糕,仔细检查一下不难挑出如下毛病:

    ●       main函数的返回值被声明为void,但实际上应该是int;

    ●       使用了GNU语法扩展,即使用long long来声明64位整数,仍不符合ANSI/ISO C语言标准;

    ●       main函数在终止前没有调用return语句。

    实例3-2 bad.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

     

     

    #include <stdio.h>

    void main(void)

    {

     long long int var = 1;

     printf("It is not standard C code!/n");

    }

    下面看看gcc是如何帮助程序员来发现这些错误的。当gcc在编译不符合ANSI/ISO C语言标准的源代码时,如果加上了-pedantic选项,那么使用了扩展语法的地方将产生相应的警告信息:

    [david@DAVID david]$ gcc -pedantic bad.c -o bad

    bad.c: In function 'main':

    bad.c:4: warning: ISO C89 does not support 'long long'

    bad.c:3: warning: return type of 'main' is not 'int'

    需要注意的是,-pedantic编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅用来帮助Linux程序员离这个目标越来越近。换句话说,-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些问题才有可能被gcc发现并提出警告。

    除了-pedantic之外,gcc还有一些其他编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使gcc产生尽可能多的警告信息。例如:

    [david@DAVID david]$ gcc -Wall bad.c -o bad

    bad.c:3: warning: return type of 'main' is not 'int'

    bad.c: In function 'main':

    bad.c:4: warning: unused variable 'var'

    bad.c:6:2: warning: no newline at end of file

    gcc给出的警告信息虽然从严格意义上说不能算作是错误,但很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持简洁、优美和健壮的特性。
        在处理警告方面,另一个常用的编译选项是-Werror,它要求gcc将所有的警告当成错误进行处理,这在使用自动编译工具(如make等)时非常有用。如果编译时带上-Werror选项,那么gcc会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改。只有当相应的警告信息消除时,才可能将编译过程继续朝前推进。执行情况如下:

    [david@DAVID david]$ gcc -Werror bad.c -o bad

    cc1: warnings being treated as errors

    bad.c: In function 'main':

    bad.c:3: warning: return type of 'main' is not 'int'

    bad.c:6:2: no newline at end of file

    对Linux程序员来讲,gcc给出的警告信息是很有价值的,它们不仅可以帮助程序员写出更加健壮的程序,而且还是跟踪和调试程序的有力工具。建议在用gcc编译源代码时始终带上-Wall选项,并把它逐渐培养成为一种习惯,这对找出常见的隐式编程错误很有帮助。

    3.4 库 依 赖

    在Linux下使用C语言开发应用程序时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助一个或多个函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。虽然Linux下大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下,但并不是所有的情况都是这样。正因如此,gcc在编译时必须让编译器知道如何来查找所需要的头文件和库文件。

    gcc采用搜索目录的办法来查找所需要的文件,-I选项可以向gcc的头文件搜索路径中添加新的目录。例如,如果在/home/david/include/目录下有编译时所需要的头文件,为了让gcc能够顺利地找到它们,就可以使用-I选项:

    [david@DAVID david]$ gcc david.c -I /home/david/include -o david

    同样,如果使用了不在标准位置的库文件,那么可以通过-L选项向gcc的库文件搜索路径中添加新的目录。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libdavid.so,为了让gcc能够顺利地找到它,可以使用下面的命令:

    [david@DAVID david]$ gcc david.c -L /home/david/lib –ldavid -o david

    值得详细解释一下的是-l选项,它指示gcc去连接库文件david.so。Linux下的库文件在命名时有一个约定,那就是应该以lib三个字母开头。由于所有的库文件都遵循了同样的规范,因此在用-l选项指定链接的库文件名时可以省去lib三个字母。也就是说gcc在对-l david进行处理时,会自动去链接名为libdavid.so的文件。

    Linux下的库文件分为两大类,分别是动态链接库(通常以.so结尾)和静态链接库(通常以.a结尾),两者的差别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。默认情况下,gcc在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库。如果需要的话可以在编译时加上-static选项,强制使用静态链接库。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libfoo.so和libfoo.a,为了让gcc在链接时只用到静态链接库,可以使用下面的命令:

    [david@DAVID david]$ gcc foo.c -L /home/david/lib -static –ldavid -o

    david

    3.5 gcc代码优化

    代码优化指的是编译器通过分析源代码,找出其中尚未达到最优的部分,然后对其重新进行组合,目的是改善程序的执行性能。gcc提供的代码优化功能非常强大,它通过编译选项-On来控制优化代码的生成,其中n是一个代表优化级别的整数。对于不同版本的gcc来讲,n的取值范围及其对应的优化效果可能并不完全相同,比较典型的范围是从0变化到2或3。

    编译时使用选项-O可以告诉gcc同时减小代码的长度和执行时间,其效果等价于-O1。在这一级别上能够进行的优化类型虽然取决于目标处理器,但一般都会包括线程跳转(Thread Jump)和延迟退栈(Deferred Stack Pops)两种优化。

    选项-O2告诉gcc除了完成所有-O1级别的优化之外,同时还要进行一些额外的调整工作,如处理器指令调度等。

    选项-O3则除了完成所有-O2级别的优化之外,还包括循环展开和其他一些与处理器特性相关的优化工作。

    通常来说,数字越大优化的等级越高,同时也就意味着程序的运行速度越快。许多Linux程序员都喜欢使用-O2选项,因为它在优化长度、编译时间和代码大小之间取得了一个比较理想的平衡点。

    下面通过具体实例来感受一下gcc的代码优化功能,所用程序如例3-3所示。

    实例3-3 count.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

     

     

    #include <stdio.h>

     int main(void)

    { double counter;

       double result;

       double temp;

       for (counter = 0; counter < 4000.0 * 4000.0 * 4000.0 / 20.0 + 2030;   

    counter += (5 - 3 +2 + 1 ) / 4)

         { temp = counter / 1239;

            result = counter;   

           } 

                    printf("Result is %lf/n", result); 

                    return 0;

    }

    首先不加任何优化选项进行编译:

    [david@DAVID david]$ gcc -Wall count.c -o count

    借助Linux提供的time命令,可以大致统计出该程序在运行时所需要的时间:

    [david@DAVID david]$ time ./count

    Result is 3200002029.000000

    real    1m59.357s

    user    1m59.140s

    sys     0m0.050s

    接下来使用优化选项来对代码进行优化处理:

    [david@DAVID david]$ gcc -Wall count.c -o count2

    在同样的条件下再次测试一下运行时间:

    [david@DAVID david]$ time ./count2

    Result is 3200002029.000000

    real    0m26.573s

    user    0m26.540s

    sys     0m0.010s

    对比两次执行的输出结果不难看出,程序的性能的确得到了很大幅度的改善,由原来的1分59秒缩短到了26秒。这个例子是专门针对gcc的优化功能而设计的,因此优化前后程序的执行速度发生了很大的改变。尽管gcc的代码优化功能非常强大,但作为一名优秀的Linux程序员,首先还是要力求能够手工编写出高质量的代码。如果编写的代码简短,并且逻辑性强,编译器就不会做更多的工作,甚至根本用不着优化。

    优化虽然能够给程序带来更好的执行性能,但在如下一些场合中应该避免优化代码。

    ●       程序开发的时候:优化等级越高,消耗在编译上的时间就越长,因此在开发的时候最好不要使用优化选项,只有到软件发行或开发结束的时候,才考虑对最终生成的代码进行优化。

    ●       资源受限的时候:一些优化选项会增加可执行代码的体积,如果程序在运行时能够申请到的内存资源非常紧张(如一些实时嵌入式设备),那就不要对代码进行优化,因为由这带来的负面影响可能会产生非常严重的后果。

    ●       跟踪调试的时候:在对代码进行优化的时候,某些代码可能会被删除或改写,或者为了取得更佳的性能而进行重组,从而使跟踪和调试变得异常困难。

    3.6 加    速

    在将源代码变成可执行文件的过程中,需要经过许多中间步骤,包含预处理、编译、汇编和连接。这些过程实际上是由不同的程序负责完成的。大多数情况下gcc可以为Linux程序员完成所有的后台工作,自动调用相应程序进行处理。

    这样做有一个很明显的缺点,就是gcc在处理每一个源文件时,最终都需要生成好几个临时文件才能完成相应的工作,从而无形中导致处理速度变慢。例如,gcc在处理一个源文件时,可能需要一个临时文件来保存预处理的输出,一个临时文件来保存编译器的输出,一个临时文件来保存汇编器的输出,而读写这些临时文件显然需要耗费一定的时间。当软件项目变得非常庞大的时候,花费在这上面的代价可能会变得很大。

    解决的办法是,使用Linux提供的一种更加高效的通信方式——管道。它可以用来同时连接两个程序,其中一个程序的输出将直接作为另一个程序的输入,这样就可以避免使用临时文件,但编译时却需要消耗更多的内存。

    注意:

    在编译过程中使用管道是由gcc的-pipe选项决定的。下面的这条命令就是借助gcc的管道功能来提高编译速度的:

    [david@DAVID david]$ gcc -pipe david.c -o david

    在编译小型工程时使用管道,编译时间上的差异可能还不是很明显,但在源代码非常多的大型工程中,差异将变得非常明显。

    3.7 gcc常用选项

    gcc作为Linux下C/C++重要的编译环境,功能强大,编译选项繁多。为了方便大家日后编译方便,在此将常用的选项及说明罗列出来,见表3-2。

    表3-2 gcc的常用选项

    选 项 名

    作    用

    -c

    通知gcc取消连接步骤,即编译源码并在最后生成目标文件

    -Dmacro

    定义指定的宏,使它能够通过源码中的#ifdef进行检验

    -E

    不经过编译预处理程序的输出而输送至标准输出

    -g3

    获得有关调试程序的详细信息,它不能与-o选项联合使用

    -Idirectory

    在包含文件搜索路径的起点处添加指定目录

    -llibrary

    提示连接程序在创建最终可执行文件时包含指定的库

    -O、-O2、-O3

    将优化状态打开,该选项不能与-g选项联合使用

    -S

    要求编译程序生成来自源代码的汇编程序输出

    -v

    启动所有警报

    .h

    预处理文件(标头文件)

    -Wall

    在发生警报时取消编译操作,即将警报看作是错误

    -w

    禁止所有的报警

     

    3.8 gcc的错误类型及对策

    如果gcc编译器发现源程序中有错误,就无法继续进行,也无法生成最终的可执行文件。为了便于修改,gcc给出错误信息,必须对这些错误信息逐个进行分析、处理,并修改相应的源代码,才能保证源代码的正确编译连接。.gcc给出的错误信息一般可以分为四大类,下面我们分别讨论其产生的原因和对策。

    ●       第一类:C语法错误

    错误信息:文件source.c中第n行有语法错误(syntex errror)。这种类型的错误,一般都是C语言的语法错误,应该仔细检查源代码文件中第n行及该行之前的程序,有时也需要对该文件所包含的头文件进行检查。有些情况下,一个很简单的语法错误,gcc会给出一大堆错误,我们最主要的是要保持清醒的头脑,不要被其吓倒,必要的时候再参考一下C语言的基本教材。在这里推荐一本由Andrew Koenig写的《C 陷阱与缺陷》(此书已由人民邮电出版社翻译出版),说得夸张一点就是此书可以帮助你减少C代码和初级C++代码中的90%的bug。

    ●       第二类:头文件错误

    错误信息:找不到头文件head.h(Can not find include file head.h)。这类错误是源代码文件中包含的头文件有问题,可能的原因有头文件名错误、指定的头文件所在目录名错误等,也可能是错误地使用了双引号和尖括号。

    ●       第三类:档案库错误

    错误信息:连接程序找不到所需的函数库,例如:

    ld: -lm: No such file or directory

    这类错误是与目标文件相连接的函数库有错误,可能的原因是函数库名错误、指定的函数库所在目录名称错误等。检查的方法是使用find命令在可能的目录中寻找相应的函数库名,确定档案库及目录的名称并修改程序中及编译选项中的名称。

    ●       第四类:未定义符号

    错误信息:有未定义的符号(Undefined symbol)。这类错误是在连接过程中出现的,可能有两种原因:一是用户自己定义的函数或者全局变量所在源代码文件,没有被编译、连接,或者干脆还没有定义,这需要用户根据实际情况修改源程序,给出全局变量或者函数的定义体;二是未定义的符号是一个标准的库函数,在源程序中使用了该库函数,而连接过程中还没有给定相应的函数库的名称,或者是该档案库的目录名称有问题,这时需要使用档案库维护命令ar检查我们需要的库函数到底位于哪一个函数库中,确定之后,修改gcc连接选项中的-l和-L项。

    排除编译、连接过程中的错误,应该说只是程序设计中最简单、最基本的一个步骤,可以说只是开了个头。这个过程中的错误,只是我们在使用C语言描述一个算法中所产生的错误,是比较容易排除的。我们写一个程序,到编译、连接通过为止,应该说刚刚开始,程序在运行过程中所出现的问题,是算法设计有问题,说得严重点儿是对问题的认识和理解不够,还需要更加深入地测试、调试和修改。一个程序,稍为复杂的程序,往往要经过多次的编译、连接、测试和修改。 gcc是在Linux下开发程序时必须掌握的工具之一。

    以上对gcc作了一个简要的介绍,主要讲述了如何使用gcc编译程序、产生警告信息、和加快gcc的编译速度。对所有希望早日跨入Linux开发者行列的人来说,gcc就是成为一名优秀的Linux程序员的起跑线。关于调试 C 程序的更多信息请看第4章关于gdb的内容。

     

    第4章 gdb 调试器

    4.1 gdb 概 述

    无论多么优秀的程序员,必须经常面对的一个问题就是调试。当程序编译完成后,他可能无法正常运行;或许程序会彻底崩溃;或许只是不能正常地运行某些功能;或许它的输出会被挂起;或许不会提示要求正常的输入。无论在何种情况下,跟踪这些问题,特别是在大的工程中,将是开发中最困难的部分,本章将介绍使用gdb(GNU debugger)调试程序的方法,该程序是一个调试器,是用来帮助程序员寻找程序中的错误的软件。

    gdb是GNU开发组织发布的一个强大的UNIX/Linux下的程序调试工具。或许,有人比较习惯图形界面方式的,像VC、BCB等IDE环境,但是在UNIX/Linux平台下做软件,gdb这个调试工具有比VC、BCB的图形化调试器更强大的功能。所谓“寸有所长,尺有所短”就是这个道理。

    一般来说,gdb主要帮忙用户完成下面4个方面的功能:

    ●       启动程序,可以按照用户自定义的要求随心所欲的运行程序。

    ●       可让被调试的程序在用户所指定的调试的断点处停住 (断点可以是条件表达式)。

    ●       当程序停住时,可以检查此时程序中所发生的事。

    ●       动态地改变程序的执行环境。

    从上面来看,gdb和一般的调试工具区别不大,基本上也是完成这些功能,不过在细节上,会发现gdb这个调试工具的强大。大家可能习惯了图形化的调试工具,但有时候,命令行的调试工具却有着图形化工具所不能完成的功能。下面通过实例4-4进行说明。

    实例4-1 test.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

     

     

    #include <stdio.h>

    int func(int n)

    {

         int sum=0,i;

         for(i=0; i<n; i++)

         {

            sum+=i;

           }

         return sum;

    }

     main()

    {

         int i;

         long result = 0;

         for(i=1; i<=100; i++)

          {

            result += i;

          }

         printf("result[1-100] = %d /n", result );

         printf("result[1-250] = %d /n", func(250) );

     }

    编译生成执行文件(Linux下):

    [david@DAVID david]$ gcc –g test.c -o test

    使用gdb调试:

    [david@DAVID david]$ gdb test <---------- 启动gdb

    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)

    Copyright 2003 Free Software Foundation, Inc.

    gdb is free software, covered by the GNU General Public License, and you are

    welcome to change it and/or distribute copies of it under certain conditions.

    Type "show copying" to see the conditions.

    There is absolutely no warranty for gdb. Type "show warranty" for details.

    This gdb was configured as "i386-redhat-Linux-gnu"...

    (gdb)

    键入 l命令相当于list命令,从第一行开始列出源码:

    [david@DAVID david]$ gdb test

    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)

    Copyright 2003 Free Software Foundation, Inc.

    gdb is free software, covered by the GNU General Public License, and you are

    welcome to change it and/or distribute copies of it under certain conditions.

    Type "show copying" to see the conditions.

    There is absolutely no warranty for gdb. Type "show warranty" for details.

    This gdb was configured as "i386-redhat-Linux-gnu"...

    (gdb) l

    7                    {

    8                           sum+=i;

    9                    }

    10                  return sum;

    11           }

    12

    13              main()

    14           {

    15                   int i;

    16                   long result = 0;

    (gdb)

    17                   for(i=1; i<=100; i++)

    18                   {

    19                           result += i;

    20                   }

    21                     printf("result[1-100] = %d /n", result );

    22                 printf("result[1-250] = %d /n", func(250) );

    23           }

    (gdb) break 16 <-------------------- 设置断点,在源程序第16行处。

    Breakpoint 1 at 0x804836a: file test.c, line 16.

    (gdb) break func <-------------------- 设置断点,在函数func()入口处。

    Breakpoint 2 at 0x804832e: file test.c, line 5.

    (gdb) info break <-------------------- 查看断点信息。

    Num Type           Disp Enb Address    What

    1   breakpoint     keep y   0x0804836a in main at test.c:16

    2   breakpoint     keep y   0x0804832e in func at test.c:5

    (gdb) r <--------------------- 运行程序,run命令简写

    Starting program: /home/david/test

     

    Breakpoint 1, main () at test.c:16 <---------- 在断点处停住。

    16                   long result = 0;

    (gdb) n <--------------------- 单条语句执行,next命令简写。

    17                   for(i=1; i<=100; i++)

    (gdb) n

    19                           result += i;

    (gdb) n

    17                   for(i=1; i<=100; i++)

    (gdb) n

    19                           result += i;

    (gdb) n

    17                   for(i=1; i<=100; i++)

    (gdb) c     <--------------------- 继续运行程序,continue命令简写。

    Continuing.

    result[1-100] = 5050  <----------程序输出。

     

    Breakpoint 2, func (n=250) at test.c:5

    5                   int sum=0,i;

    (gdb) n

    6                    for(i=0; i<n; i++)

    (gdb) p I    <--------------------- 打印变量i的值,print命令简写。

    $1 = 1107620064

    (gdb) n

    8                           sum+=i;

    (gdb) n

    6                    for(i=0; i<n; i++)

    (gdb) p sum

    $2 = 0

    (gdb) bt     <--------------------- 查看函数堆栈。

    #0 func (n=250) at test.c:6

    #1 0x080483b2 in main () at test.c:22

    #2 0x42015574 in __libc_start_main () from /lib/tls/libc.so.6

    (gdb) finish <--------------------- 退出函数。

    Run till exit from #0 func (n=250) at test.c:6

    0x080483b2 in main () at test.c:22

    22   printf("result[1-250] = %d /n", func(250) );

    Value returned is $3 = 31125

    (gdb) c <--------------------- 继续运行。

    Continuing.

    result[1-250] = 31125

     

    Program exited with code 027. <--------程序退出,调试结束。

    (gdb) q     <--------------------- 退出gdb。

    [david@DAVID david]$

    有了以上的感性认识,下面来系统地学习一下gdb。

    4.2 使 用 gdb

    gdb主要调试的是C/C++的程序。要调试C/C++的程序,首先在编译时,必须要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的 -g 参数即可。如:

    [david@DAVID david]$ gcc -g hello.c -o hello

    [david@DAVID david]$ g++ -g hello.cpp -o hello

    如果没有-g,将看不见程序的函数名和变量名,代替它们的全是运行时的内存地址。当用-g把调试信息加入,并成功编译目标代码以后,看看如何用gdb来调试。

    启动gdb的方法有以下几种:

    1. gdb <program>

    program也就是执行文件,一般在当前目录下。

    2. gdb <program> core

    用gdb同时调试一个运行程序和core文件,core是程序非法执行后,core dump后产生的文件。

    3. gdb <program> <PID>

    如果程序是一个服务程序,那么可以指定这个服务程序运行时的进程ID。gdb会自动attach上去,并调试它。program应该在PATH环境变量中搜索得到。 

    gdb启动时,可以加上一些gdb的启动开关,详细的开关可以用gdb -help查看。下面只列举一些比较常用的参数:

    -symbols <file>

    -s <file>

    从指定文件中读取符号表。

    -se file

    从指定文件中读取符号表信息,并把它用在可执行文件中。

    -core <file>

    -c <file>

    调试时core dump的core文件。

    -directory <directory>

    -d <directory>

    加入一个源文件的搜索路径。默认搜索路径是环境变量中PATH所定义的路径。

    4.2.1 gdb的命令概貌

    启动gdb后,进入gdb的调试环境中,就可以使用gdb的命令开始调试程序了。gdb的命令可以使用help命令来查看,如下所示:   

    [david@DAVID david]$ gdb

    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)

    Copyright 2003 Free Software Foundation, Inc.

    gdb is free software, covered by the GNU General Public License, and you are

    welcome to change it and/or distribute copies of it under certain conditions.

    Type "show copying" to see the conditions.

    There is absolutely no warranty for gdb. Type "show warranty" for details.

    This gdb was configured as "i386-redhat-Linux-gnu".

    (gdb) help

    List of classes of commands:

    aliases -- Aliases of other commands

    breakpoints -- Making program stop at certain points

    data -- Examining data

    files -- Specifying and examining files

    internals -- Maintenance commands

    obscure -- Obscure features

    running -- Running the program

    stack -- Examining the stack

    status -- Status inquiries

    support -- Support facilities

    tracepoints -- Tracing of program execution without stopping the program

    user-defined -- User-defined commands

     

    Type "help" followed by a class name for a list of commands in that class.

    Type "help" followed by command name for full documentation.

    Command name abbreviations are allowed if unambiguous.

    (gdb)

    gdb的命令很多,gdb将之分成许多种类。help命令只是列出gdb的命令种类,如果要看其中的命令,可以使用help <class> 命令。如:

    (gdb) help data

    Examining data.

    List of commands:

    append -- Append target code/data to a local file

    call -- Call a function in the program

    delete display -- Cancel some expressions to be displayed when program stops

    delete mem -- Delete memory region

    disable display -- Disable some expressions to be displayed when program stops

    disable mem -- Disable memory region

    disassemble -- Disassemble a specified section of memory

    display -- Print value of expression EXP each time the program stops

    dump -- Dump target code/data to a local file

    enable display -- Enable some expressions to be displayed when program stops

    enable mem -- Enable memory region

    inspect -- Same as "print" command

    mem -- Define attributes for memory region

    output -- Like "print" but don't put in value history and don't print newline

    print -- Print value of expression EXP

    printf -- Printf "printf format string"

    ptype -- Print definition of type TYPE

    restore -- Restore the contents of FILE to target memory

    set -- Evaluate expression EXP and assign result to variable VAR

    set variable -- Evaluate expression EXP and assign result to variable VAR

    undisplay -- Cancel some expressions to be displayed when program stops

    whatis -- Print data type of expression EXP

    x -- Examine memory: x/FMT ADDRESS

     

    Type "help" followed by command name for full documentation.

    Command name abbreviations are allowed if unambiguous.

    (gdb)

    也可以直接用help [command]来查看命令的帮助。

    gdb中,输入命令时,可以不用输入全部命令,只用输入命令的前几个字符就可以了。当然,命令的前几个字符应该标志着一个惟一的命令,在Linux下,可以按两次TAB键来补齐命令的全称,如果有重复的,那么gdb会把它全部列出来。

    示例一:在进入函数func时,设置一个断点。可以输入break func,或是直接输入b func。

    (gdb) b func

    Breakpoint 1 at 0x804832e: file test.c, line 5.

    (gdb)

    示例二:输入b按两次TAB键,你会看到所有b开头的命令。

    (gdb) b

    backtrace break bt

    要退出gdb时,只用输入quit或其简称q就行了。 

    4.2.2 gdb中运行Linux的shell程序

    在gdb环境中,可以执行Linux的shell命令:

    shell <command string>

    调用Linux的shell来执行<command string>,环境变量SHELL中定义的Linux的shell将会用来执行<command string>。如果SHELL没有定义,那就使用Linux的标准shell:/bin/sh(在Windows中使用Command.com或cmd.exe)。

    还有一个gdb命令是make:

    make <make-args>

    可以在gdb中执行make命令来重新build自己的程序。这个命令等价于shell make <make-args>。 

    4.2.3 在gdb中运行程序

    当以gdb <program>方式启动gdb后,gdb会在PATH路径和当前目录中搜索<program>的源文件。如要确认gdb是否读到源文件,可使用l或list命令,看看gdb是否能列出源代码。

    在gdb中,运行程序使用r或是run命令。程序的运行,有可能需要设置下面四方面的事。

    1. 程序运行参数

    set args 可指定运行时参数。如:

    set args 10 20 30 40 50

    show args 命令可以查看设置好的运行参数。

    2. 运行环境

    path <dir> 可设定程序的运行路径。

    show paths 查看程序的运行路径。

    set environment varname [=value] 设置环境变量。如:

    set env USER=hchen

    show environment [varname] 查看环境变量。

    3. 工作目录

    cd <dir> 相当于shell的cd命令。

    pwd 显示当前的所在目录。

    4. 程序的输入输出

    info terminal 显示程序用到的终端的模式。

    使用重定向控制程序输出。如:

    run > outfile

    tty命令可以指写输入输出的终端设备。如:

    tty /dev/ttyb

    4.2.4 调试已运行的程序

    调试已经运行的程序有两种方法:

    ●       在Linux下用ps(第一章已经对ps作了介绍)查看正在运行的程序的PID(进程ID),然后用gdb <program> PID格式挂接正在运行的程序。

    ●       先用gdb <program>关联上源代码,并进行gdb,在gdb中用attach命令来挂接进程的PID,并用detach来取消挂接的进程。

    4.2.5 暂停/恢复程序运行

    调试程序中,暂停程序运行是必需的,gdb可以方便地暂停程序的运行。可以设置程序在哪行停住,在什么条件下停住,在收到什么信号时停往等,以便于用户查看运行时的变量,以及运行时的流程。

    当进程被gdb停住时,可以使用info program 来查看程序是否在运行、进程号、被暂停的原因。

    在gdb中,有以下几种暂停方式:断点(BreakPoint)、观察点(WatchPoint)、捕捉点(CatchPoint)、信号(Signals)及线程停止(Thread Stops)。

    如果要恢复程序运行,可以使用c或是continue命令。

    1. 设置断点(BreakPoint)  

    用break命令来设置断点。有下面几种设置断点的方法:

    break <function>

    在进入指定函数时停住。C++中可以使用class::function或function(type,type)格式来指定函数名。

    break <linenum>

    在指定行号停住。

    break +offset

    break -offset

    在当前行号的前面或后面的offset行停住。offiset为自然数。

    break filename:linenum

    在源文件filename的linenum行处停住。

    break filename:function

    在源文件filename的function函数的入口处停住。

    break *address

    在程序运行的内存地址处停住。

    break

    该命令没有参数时,表示在下一条指令处停住。

    break ... if <condition>

    condition表示条件,在条件成立时停住。比如在循环体中,可以设置break if i=100,表示当i为100时停住程序。

    查看断点时,可使用info命令,如下所示(注:n表示断点号):

    info breakpoints [n]

    info break [n] 

    2. 设置观察点(WatchPoint)  

    观察点一般用来观察某个表达式(变量也是一种表达式)的值是否变化了。如果有变化,马上停住程序。有下面的几种方法来设置观察点: 

    watch <expr>

    为表达式(变量)expr设置一个观察点。一旦表达式值有变化时,马上停住程序。    

    rwatch <expr>

    当表达式(变量)expr被读时,停住程序。   

    awatch <expr>

    当表达式(变量)的值被读或被写时,停住程序。

    info watchpoints

    列出当前设置的所有观察点。

    3. 设置捕捉点(CatchPoint)

    可设置捕捉点来补捉程序运行时的一些事件。如载入共享库(动态链接库)或是C++的异常。设置捕捉点的格式为:

    catch <event>

    当event发生时,停住程序。event可以是下面的内容:

    ●       throw 一个C++抛出的异常 (throw为关键字)。

    ●       catch 一个C++捕捉到的异常 (catch为关键字)。

    ●       exec 调用系统调用exec时(exec为关键字,目前此功能只在HP-UX下有用)。

    ●       fork 调用系统调用fork时(fork为关键字,目前此功能只在HP-UX下有用)。

    ●       vfork 调用系统调用vfork时(vfork为关键字,目前此功能只在HP-UX下有)。

    ●       load 或 load <libname> 载入共享库(动态链接库)时 (load为关键字,目前此功能只在HP-UX下有用)。

    ●       unload 或 unload <libname> 卸载共享库(动态链接库)时 (unload为关键字,目前此功能只在HP-UX下有用)。

    tcatch <event>

    只设置一次捕捉点,当程序停住以后,应点被自动删除。

    4. 维护停止点

    上面说了如何设置程序的停止点,gdb中的停止点也就是上述的三类。在gdb中,如果觉得已定义好的停止点没有用了,可以使用delete、clear、disable、enable这几个命令来进行维护。

    Clear

    清除所有的已定义的停止点。

    clear <function>

    clear <filename:function>

    清除所有设置在函数上的停止点。

    clear <linenum>

    clear <filename:linenum>

    清除所有设置在指定行上的停止点。

    delete [breakpoints] [range...]

    删除指定的断点,breakpoints为断点号。如果不指定断点号,则表示删除所有的断点。range 表示断点号的范围(如:3-7)。其简写命令为d。

    比删除更好的一种方法是disable停止点。disable了的停止点,gdb不会删除,当还需要时,enable即可,就好像回收站一样。

    disable [breakpoints] [range...]

    disable所指定的停止点,breakpoints为停止点号。如果什么都不指定,表示disable所有的停止点。简写命令是dis.

    enable [breakpoints] [range...]

    enable所指定的停止点,breakpoints为停止点号。

    enable [breakpoints] once range...

    enable所指定的停止点一次,当程序停止后,该停止点马上被gdb自动disable。

    enable [breakpoints] delete range...

    enable所指定的停止点一次,当程序停止后,该停止点马上被gdb自动删除。

    5. 停止条件维护

    前面在介绍设置断点时,提到过可以设置一个条件,当条件成立时,程序自动停止。这是一个非常强大的功能,这里,专门介绍这个条件的相关维护命令。

    一般来说,为断点设置一个条件,可使用if关键词,后面跟其断点条件。并且,条件设置好后,可以用condition命令来修改断点的条件(只有break和watch命令支持if,catch目前暂不支持if)。

    condition <bnum> <expression>

    修改断点号为bnum的停止条件为expression。

    condition <bnum>

    清除断点号为bnum的停止条件。

    还有一个比较特殊的维护命令ignore,可以指定程序运行时,忽略停止条件几次。

    ignore <bnum> <count>

    表示忽略断点号为bnum的停止条件count次。

    6. 为停止点设定运行命令

    可以使用gdb提供的command命令来设置停止点的运行命令。也就是说,当运行的程序在被停住时,我们可以让其自动运行一些别的命令,这很有利行自动化调试。

    commands [bnum]

    ... command-list ...

    end

    为断点号bnum指定一个命令列表。当程序被该断点停住时,gdb会依次运行命令列表中的命令。

    例如:

    break foo if x>0

    commands

    printf "x is %d/n",x

    continue

    end

    断点设置在函数foo中,断点条件是x>0,如果程序被断住后,也就是一旦x的值在foo函数中大于0,gdb会自动打印出x的值,并继续运行程序。

    如果要清除断点上的命令序列,那么只要简单地执行一下commands命令,并直接在输入end就行了。

    7. 断点菜单

    在C++中,可能会重复出现同一个名字的函数若干次(函数重载)。在这种情况下,break <function>不能告诉gdb要停在哪个函数的入口。当然,可以使用break <function(type)>,也就是把函数的参数类型告诉gdb,以指定一个函数。否则的话,gdb会列出一个断点菜单供用户选择所需要的断点。只要输入菜单列表中的编号就可以了。如:

    (gdb) b String::after

    [0] cancel

    [1] all

    [2] file:String.cc; line number:867

    [3] file:String.cc; line number:860

    [4] file:String.cc; line number:875

    [5] file:String.cc; line number:853

    [6] file:String.cc; line number:846

    [7] file:String.cc; line number:735

    > 2 4 6

    Breakpoint 1 at 0xb26c: file String.cc, line 867.

    Breakpoint 2 at 0xb344: file String.cc, line 875.

    Breakpoint 3 at 0xafcc: file String.cc, line 846.

    Multiple breakpoints were set.

    Use the "delete" command to delete unwanted

    breakpoints.

    (gdb)   

    可见,gdb列出了所有after的重载函数,选一下列表编号就行了。0表示放弃设置断点,1表示所有函数都设置断点。

    8. 恢复程序运行和单步调试

    当程序被停住后,可以用continue命令恢复程序的运行直到程序结束,或下一个断点到来。也可以使用step或next命令单步跟踪程序。

    continue [ignore-count]

    c [ignore-count]

    fg [ignore-count]

    恢复程序运行,直到程序结束,或是下一个断点到来。ignore-count表示忽略其后的断点次数。continue,c,fg三个命令都是一样的意思。

    step <count>

    单步跟踪,如果有函数调用,它会进入该函数。进入函数的前提是,此函数被编译有debug信息。很像VC等工具中的step in。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。

    next <count>

    同样单步跟踪,如果有函数调用,它不会进入该函数(很像VC等工具中的step over)。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。

    set step-mode

    set step-mode on

    打开step-mode模式。在进行单步跟踪时,程序不会因为没有debug信息而不停住。这个参数有很利于查看机器码。

    set step-mod off

    关闭step-mode模式。

    finish

    运行程序,直到当前函数完成返回。并打印函数返回时的堆栈地址和返回值及参数值等信息。

    until 或 u

    当厌倦了在一个循环体内单步跟踪时,这个命令可以运行程序直到退出循环体。

    stepi 或 si

    nexti 或 ni

    单步跟踪一条机器指令。一条程序代码有可能由数条机器指令完成,stepi和nexti可以单步执行机器指令。与之一样有相同功能的命令是display/i $pc,当运行完这个命令后,单步跟踪会在显示出程序代码的同时显示出机器指令(也就是汇编代码)。

    9. 信号(Signals)

    信号是一种软中断,是一种处理异步事件的方法。

    一般来说,操作系统都支持许多信号,尤其是Linux,比较重要的应用程序一般都会处理信号。Linux定义了许多信号,比如SIGINT表示中断字符信号,也就是Ctrl+C的信号,SIGBUS表示硬件故障的信号;SIGCHLD表示子进程状态改变信号;SIGKILL表示终止程序运行的信号等。信号量编程是UNIX下非常重要的一种技术。

    gdb有能力在调试程序的时候处理任何一种信号。可以告诉gdb需要处理哪一种信号;可以要求gdb收到所指定的信号时,马上停住正在运行的程序,以供用户进行调试。可用gdb的handle命令来完成这一功能。

    handle <signal> <keywords...>

    在gdb中定义一个信号处理。信号<signal>可以以SIG开头或不以SIG开头,可以定义一个要处理信号的范围(如:SIGIO-SIGKILL,表示处理从SIGIO信号到SIGKILL的信号,其中包括SIGIO,SIGIOT,SIGKILL三个信号),也可以使用关键字all来标明要处理所有的信号。一旦被调试的程序接收到信号,运行程序马上会被gdb停住,以供调试。其<keywords>可以是以下几种关键字中的一个或多个。

    nostop

    当被调试的程序收到信号时,gdb不会停住程序的运行,但会显示出消息告诉用户收到这种信号。

    stop

    当被调试的程序收到信号时,gdb会停住程序。

    print

    当被调试的程序收到信号时,gdb会显示出一条信息。

    noprint

    当被调试的程序收到信号时,gdb不会告诉用户收到信号的信息。

    Pass

    noignore

    当被调试的程序收到信号时,gdb不处理信号。这表示gdb会把这个信号交给被调试程序处理。

    Nopass

    ignore

    当被调试的程序收到信号时,gdb不会让被调试程序来处理这个信号。

    info signals

    info handle

    查看有哪些信号在被gdb检测。

     

     

    10. 线程(Thread Stops)

    如果程序是多线程的话,可以定义断点是否在所有的线程上,或是在某个特定的线程上。gdb很容易完成这一工作。

    break <linespec> thread <threadno>

    break <linespec> thread <threadno> if ...

    linespec指定了断点设置的源程序的行号。threadno指定了线程的ID,注意,这个ID是gdb分配的,可以通过info threads命令来查看正在运行程序中的线程信息。如果不指定thread <threadno>则表示断点设在所有线程上面。还可以为某线程指定断点条件。如:

    (gdb) break frik.c:13 thread 28 if bartab > lim

    当程序被gdb停住时,所有的运行线程都会被停住。这方便用户查看运行程序的总体情况。而在恢复程序运行时,所有的线程也会被恢复运行。那怕是主进程在被单步调试时。

    4.2.6 查看栈信息

    当程序被停住时,需要做的第一件事就是查看程序是在哪里停住的。当程序调用了一个函数时,函数的地址、函数参数、函数内的局部变量都会被压入“栈”(Stack)中。可以用gdb命令来查看当前的栈中的信息。

    下面是一些查看函数调用栈信息的gdb命令:

    backtrace

    bt

    打印当前的函数调用栈的所有信息。如:

    (gdb) bt

    #0 func (n=250) at tst.c:6

    #1 0x08048524 in main (argc=1, argv=0xbffff674) at tst.c:30

    #2 0x400409ed in __libc_start_main () from /lib/libc.so.6

    从上可以看出函数的调用栈信息:__libc_start_main --> main() --> func()   

    backtrace <n>

    bt <n>

    n是一个正整数,表示只打印栈顶上n层的栈信息。

    backtrace <-n>

    bt <-n>

    -n表示一个负整数,表示只打印栈底下n层的栈信息。     

    如果要查看某一层的信息,需要切换当前的栈。一般来说,程序停止时,最顶层的栈就是当前栈,如果要查看栈下面层的详细信息,首先要做的是切换当前栈。

    frame <n>

    f <n>

    n是一个从0开始的整数,是栈中的层编号。比如:frame 0表示栈顶,frame 1表示栈的第二层。 

    up <n>

    表示向栈的上面移动n层,可以不输入n,表示向上移动一层。

    down <n>

    表示向栈的下面移动n层,可以不输入n,表示向下移动一层。    

    上面的命令,都会输出移动到的栈层的信息。如果不想让其输出信息。可以使用这三个命令:

    ●       select-frame <n> 对应于 frame 命令。

    ●       up-silently <n> 对应于 up 命令。

    ●       down-silently <n> 对应于 down 命令。

    查看当前栈层的信息,可以用以下gdb命令:

    frame 或 f

    显示出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句。

    info frame

    info f

    命令会显示出更为详细的当前栈层的信息,只不过,大多数都是运行时的内内地址。比如:函数地址,调用函数的地址,被调用函数的地址,目前函数的程序语言、函数参数地址及值、局部变量的地址等。如:

    (gdb) bt

    #0 main () at test.c:23

    #1 0x42015574 in __libc_start_main () from /lib/tls/libc.so.6

    (gdb) info f

    Stack level 0, frame at 0xbfffef48:

     eip = 0x80483c3 in main (test.c:23); saved eip 0x42015574

     called by frame at 0xbfffef68

     source language c.

     Arglist at 0xbfffef48, args:

     Locals at 0xbfffef48, Previous frame's sp in esp

     Saved registers:

     ebp at 0xbfffef48, eip at 0xbfffef4c

    (gdb)

    info args

    显示出当前函数的参数名及值。

    info locals

    显示出当前函数中所有局部变量及值。  

    info catch

    显示出当前函数中的异常处理信息。  

    4.2.7 查看源程序

    1. 显示源代码

    gdb 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上-g参数,把源程序信息编译到执行文件中,不然就看不到源程序了。当程序停下来以后,gdb会报告程序停在了程序的第几行上。可以用list命令来显示程序的源代码。下面介绍查看源代码的gdb命令。

    list <linenum>

    显示程序第linenum行的周围的源程序。

    list <function>

    显示函数名为function的函数的源程序。    

    list

    显示当前行后面的源程序。 

    list -

    显示当前行前面的源程序。

    一般是显示当前行的上5行和下5行,或者显示当前行的上2行和下8行,默认共显示10行。当然,也可以定制显示的范围。使用下面的命令可以设置一次显示源程序的行数:

    set listsize <count>

    设置一次显示源代码的行数。   

    show listsize

    查看当前listsize的设置。    

    list命令还有下面的用法:

    list <first>, <last>

    显示从first行到last行之间的源代码。

    list , <last>

    显示从当前行到last行之间的源代码。

    list +

    向后显示源代码。     

    一般来说,在list后面可以跟以下这些的参数:

    ●       <linenum>   行号

    ●       <+offset>   当前行号的正偏移量

    ●       <-offset>   当前行号的负偏移量

    ●       <filename:linenum> 哪个文件的哪一行

    ●       <function> 函数名

    ●       <filename:function> 哪个文件中的哪个函数

    ●       <*address> 程序运行时的语句在内存中的地址

    2. 搜索源代码

    不仅如此,gdb还提供了源代码搜索的命令:

    forward-search <regexp>

    search <regexp>

    向前面搜索。

    reverse-search <regexp>

    全部搜索。 

    其中,<regexp>就是正则表达式,也是一个字符串的匹配模式,关于正则表达式,就不在这里讲了,请查看相关资料。

    3. 指定源文件的路径

    某些时候,用-g编译过后的执行程序中只是包括了源文件的名字,没有路径名。gdb提供了可以让用户指定源文件的路径的命令,以便gdb进行搜索。

    directory <dirname ... >

    dir <dirname ... >

    加一个源文件路径到当前路径的前面。如果要指定多个路径,在UNIX下可以使用“:”,在Windows下可以使用“;”。

    directory

    清除所有的自定义的源文件搜索路径信息。

    show directories

    显示定义了的源文件搜索路径。   

    4. 源代码的内存

    可以使用info line命令来查看源代码在内存中的地址。info line后面可以跟“行号” 、“函数名” 、“文件名:行号” 、“文件名:函数名”,这个命令会显示出所指定的源码在运行时的内存地址,如:

    ((gdb) info line test.c : func

    Line 4 of "test.c" starts at address 0x8048328 <func>

    and ends at 0x804832e <func+6>.

    还有一个命令(disassemble)可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令dump出来。如下面的示例表示查看函数func的汇编代码:

    (gdb) disassemble func

    Dump of assembler code for function func:

    0x08048328 <func+0>:    push   %ebp

    0x08048329 <func+1>:    mov    %esp,%ebp

    0x0804832b <func+3>:    sub    $0x8,%esp

    0x0804832e <func+6>:    movl   $0x0,0xfffffffc(%ebp)

    0x08048335 <func+13>:   movl   $0x0,0xfffffff8(%ebp)

    0x0804833c <func+20>:   mov    0xfffffff8(%ebp),%eax

    0x0804833f <func+23>:   cmp    0x8(%ebp),%eax

    0x08048342 <func+26>:   jl     0x8048346 <func+30>

    0x08048344 <func+28>:   jmp    0x8048355 <func+45>

    0x08048346 <func+30>:   mov    0xfffffff8(%ebp),%eax

    0x08048349 <func+33>:   lea    0xfffffffc(%ebp),%edx

    0x0804834c <func+36>:   add    %eax,(%edx)

    0x0804834e <func+38>:   lea    0xfffffff8(%ebp),%eax

    0x08048351 <func+41>:   incl   (%eax)

    0x08048353 <func+43>:   jmp    0x804833c <func+20>

    0x08048355 <func+45>:   mov    0xfffffffc(%ebp),%eax

    0x08048358 <func+48>:   leave

    0x08048359 <func+49>:   ret

    End of assembler dump.

    (gdb)

    4.2.8 查看运行时数据 

    在调试程序时,当程序被停住时,可以使用print命令(简写命令为p),或是同义命令inspect来查看当前程序的运行数据。print命令的格式是:

    print <expr>

    print /<f> <expr>

    <expr>是表达式,是所调试的程序的语言的表达式(gdb可以调试多种编程语言);<f>是输出的格式。比如,如果要把表达式按16进制的格式输出,那么就是/x。

     1. 表达式

    print和许多gdb的命令一样,可以接受一个表达式,gdb会根据当前的程序运行的数据来计算这个表达式。既然是表达式,那么就可以是当前程序运行中的常量、变量、函数等内容。可惜的是gdb不能使用在程序中所定义的宏。

    表达式的语法应该是当前所调试的语言的语法,由于C/C++是一种大众型的语言,所以,本文中的例子都是关于C/C++的。而关于用gdb调试其他语言的内容,将在后面介绍。

    在表达式中,有几种gdb所支持的操作符,它们可以用在任何一种语言中。

    @

    是一个和数组有关的操作符,在后面会有更详细的说明。    

    ::

    指定一个在文件或是一个函数中的变量。  

    {<type>} <addr>

    表示一个指向内存地址<addr>的类型为type的一个对象。       

    2. 程序变量

    在gdb中,可以随时查看以下3种变量的值:

    ●       全局变量(所有文件可见的)

    ●       静态全局变量(当前文件可见的)

    ●       局部变量(当前Scope可见的)    

    如果局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量。也就是说,如果一个全局变量和一个函数中的局部变量同名时,如果当前停止点在函数中,用print显示出的变量的值会是函数中的局部变量的值。如果此时想查看全局变量的值,可以使用“::”操作符:

    file::variable

    function::variable

    可以通过这种形式指定所要查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件f2.c中的全局变量x的值:

    (gdb) p 'f2.c'::x

    当然,“::”操作符会和C++中的发生冲突,gdb能自动识别“::”是否C++的操作符,所以不必担心在调试C++程序时会出现异常。

    另外,需要注意的是,如果程序编译时开启了优化选项,那么在用gdb调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误的情况。这个是很正常的,因为优化程序会删改程序,整理程序的语句顺序,剔除一些无意义的变量等。所以在gdb调试这种程序时,运行时的指令和所编写的指令就不一样,也就会出现想象不到的结果。对付这种情况,需要在编译程序时关闭编译优化。一般来说,几乎所有的编译器都支持编译优化的开关,例如,GNU的C/C++编译器GCC,可以使用-gstabs选项来解决这个问题。关于编译器的参数,请查看编译器的使用说明文档。

    3. 数组

    有时候需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。可以使用gdb的@操作符。@的左边是第一个内存地址的值,@的右边则是想查看的内存的长度。例如,程序中有这样的语句:

    int *array = (int *) malloc (len *sizeof (int));

    于是,在gdb调试过程中,可以用如下命令显示出这个动态数组的取值:

    p *array@len

    @的左边是数组的首地址的值,也就是变量array所指向的内容,右边则是数据的长度,其保存在变量len中。其输出结果,大约是下面这个样子的:   

    (gdb) p *array@len
            $1={2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40}

    如果是静态数组的话,直接用print数组名就可以显示数组中所有数据的内容了。

    4. 输出格式

    一般来说,gdb会根据变量的类型输出变量的值。但也可以自定义gdb的输出格式。例如,想输出一个整数的十六进制或是二进制来查看这个整型变量中的位的情况。要做到这样,可以使用gdb的数据显示格式:

    ●       x  按十六进制格式显示变量。

    ●       d  按十进制格式显示变量。

    ●       u  按十六进制格式显示无符号整型。

    ●       o  按八进制格式显示变量。

    ●       t  按二进制格式显示变量。

    ●       a  按十六进制格式显示变量。

    ●       c  按字符格式显示变量。

    ●       f  按浮点数格式显示变量。

    (gdb) p i

    $21 = 101   

    (gdb) p/a i

    $22 = 0x65

    (gdb) p/c i

    $23 = 101 'e'

    (gdb) p/f i

    $24 = 1.41531145e-43

    (gdb) p/x i

    $25 = 0x65

    (gdb) p/t i

    $26 = 1100101

    5. 查看内存

    可以使用examine命令(简写是x)来查看内存地址中的值。x命令的语法如下所示:

    x/<n/f/u> <addr> 

    ●       n、f、u是可选的参数。 

    ●       n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。

    ●       f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是s,如果是指令地址,那么格式可以是i。

    ●       u 表示从当前地址往后请求的字节数,如果不指定的话,gdb默认是4个bytes。u参数可以用下面的字符来代替:b表示单字节,h表示双字节,w表示四字节,g表示八字节。当指定了字节长度后,gdb会从指定的内存地址开始,读写指定字节,并把其当作一个值取出来。

    ●       <addr>表示一个内存地址。

    n/f/u三个参数可以一起使用。例如:

    x/3uh 0x54320

    表示从内存地址0x54320读取内容,h表示以双字节为1个单位,3表示3个单位,u表示按十六进制显示。

    6. 自动显示

    可以设置一些自动显示的变量,当程序停住时,或是在单步跟踪时,这些变量会自动显示。相关的gdb命令是display。

    display <expr>

    display/<fmt> <expr>

    display/<fmt> <addr>

    expr是一个表达式,fmt表示显示的格式,addr表示内存地址。当用display设定好了一个或多个表达式后,只要程序停下来,gdb会自动显示所设置的这些表达式的值。  

    格式i和s同样被display支持,一个非常有用的命令是: 

    display/i $pc

    $pc是gdb的环境变量,表示指令的地址,/i则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。

    下面是一些和display相关的gdb命令:

    undisplay <dnums...>

    delete display <dnums...>

    删除自动显示,dnums意为设置好了的自动显示的编号。如果要同时删除几个编号,可以用空格分隔;如果要删除一个范围内的编号,可以用减号表示(如:2-5)。

    disable display <dnums...>

    enable display <dnums...>

    disable和enalbe不删除自动显示的设置,而只是让其失效和恢复。

    info display

    查看display设置的自动显示的信息。gdb会显示出一张表格,报告调试中设置了多少个自动显示设置,其中包括设置的编号、表达式及是否enable。

    7. 设置显示选项

    gdb中关于显示的选项比较多,这里只列举大多数常用的选项。

    set print address

    set print address on

    打开地址输出,当程序显示函数信息时,gdb会显出函数的参数地址。系统默认为打开的,如:       

    (gdb) f

    #0 set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")

    at input.c:530

    530         if (lquote != def_lquote)

    set print address off

    关闭函数的参数地址显示,如:

    (gdb) set print addr off

    (gdb) f

    #0 set_quotes (lq="<<", rq=">>") at input.c:530

    530         if (lquote != def_lquote)

    show print address

    查看当前地址显示选项是否打开。  

    set print array

    set print array on

    打开数组显示。打开后当数组显示时,每个元素占一行;如果不打开的话,每个元素以逗号分隔。这个选项默认是关闭的。

    set print array off

    show print array

    set print elements <number-of-elements>

    这个选项主要是设置数组的,如果数组太大了,就可以指定一个<number-of-elements>来指定数据显示的最大长度,当达到这个长度时,gdb就不再往下显示了。如果设置为0,则表示不限制。  

    show print elements

    查看print elements的选项信息。       

    set print null-stop <on/off>

    如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为off。  

    set print pretty on

    如果打开printf pretty这个选项,那么当gdb显示结构体时会比较漂亮。如:

                                 $1 = {

                                    next = 0x0,

                                              flags = {

                                                      sweet = 1,

                                                     our = 1

                                              },

                                              meat = 0x54 "Pork"

                               }

    set print pretty off

    关闭printf pretty这个选项,gdb显示结构体时会如下显示:

    $1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}  

    show print pretty

    查看gdb是如何显示结构体的。

    set print sevenbit-strings <on/off>

    设置字符显示,是否按“/nnn”的格式显示。如果打开,则字符串或字符数据按/nnn显示,如“/065”。

    show print sevenbit-strings

    查看字符显示开关是否打开。 

    set print union <on/off>

    设置显示结构体时,是否显示其内的联合体数据。例如有以下数据结构:

                   typedef enum {Tree, Bug} Species;

                          typedef enum {Big_tree, Acorn, Seedling} Tree_forms;

                        typedef enum {Caterpillar, Cocoon, Butterfly}

                                 Bug_forms;

           

                        struct thing {

                      Species it;

                      union {

                    Tree_forms tree;

                    Bug_forms bug;

                        } form;

                        };

    struct thing foo = {Tree, {Acorn}};

    当打开这个开关时,执行 p foo 命令后,会如下显示:

    $1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}

    当关闭这个开关时,执行 p foo 命令后,会如下显示:

    $1 = {it = Tree, form = {...}}

    show print union

    查看联合体数据的显示方式。

    set print object <on/off>

    在C++中,当一个对象指针指向其派生类时,如果打开这个选项,gdb会自动按照虚方法调用的规则显示输出,如果关闭这个选项,gdb就不管虚函数表了。这个选项默认是off。

    show print object

    查看对象选项的设置。  

    set print static-members <on/off>

    这个选项表示,当显示一个C++对象中的内容时,是否显示其中的静态数据成员。默认是on。

    show print static-members

    查看静态数据成员选项设置。  

    set print vtbl <on/off>

    当此选项打开时,gdb将用比较规整的格式来显示虚函数表时。其默认是关闭的。 

    show print vtbl

    查看虚函数显示格式的选项。     

    8. 历史记录

    当用gdb的print查看程序运行时的数据时,每一个print都会被gdb记录下来。gdb会以$1, $2, $3 .....这样的方式为每一个print命令编上号。于是,可以使用这个编号访问以前的表达式,如$1。这个功能所带来的好处是,如果先前输入了一个比较长的表达式,并想查看这个表达式的值,可以使用历史记录来访问,省去了重复输入。  

    9. gdb环境变量

    可以在gdb的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。

    要定义一个gdb的变量很简单,只需使用gdb的set命令。gdb的环境变量和UNIX一样,也是以$起头。如:

    set $foo = *object_ptr 

    使用环境变量时,gdb会在第一次使用时创建这个变量,而在以后的使用中,则直接对其赋值。环境变量没有类型,可以给环境变量定义任意的类型,包括结构体和数组。

    show convenience

    该命令查看当前所设置的所有的环境变量。    

    这是一个比较强大的功能,环境变量和程序变量的交互使用将使得程序调试更为灵活便捷。例如:

    set $i = 0

    print bar[$i++]->contents

    输入这样的命令后,只用按回车键,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。   

    10. 查看寄存器

    要查看寄存器的值,很简单,可以使用如下命令:

    info registers

    查看寄存器的情况(除了浮点寄存器)。

    info all-registers

    查看所有寄存器的情况(包括浮点寄存器)。

    info registers <regname ...>

    查看所指定的寄存器的情况。

    寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址(ip),程序的当前堆栈地址(sp)等。同样可以使用print命令来访问寄存器的情况,只需要在寄存器名字前加一个$符号就可以了,如p。

    4.2.9 改变程序的执行

    一旦使用gdb挂上被调试程序,当程序运行起来后,可以根据自己的调试思路来动态地在gdb中更改当前被调试程序的运行线路或是其变量的值。这个强大的功能能够让用户更好地调试程序。比如,可以在程序的一次运行中走遍程序的所有分支。

    1. 修改变量值

    修改被调试程序运行时的变量值在gdb中很容易实现,使用gdb的print命令即可完成。如:

    (gdb) print x=4

    x=4这个表达式是C/C++的语法,意为把变量x的值修改为4,如果当前调试的语言是Pascal,那么可以使用Pascal的语法x:=4。

    在某些时候,变量很有可能和gdb中的参数冲突,如:      

    (gdb) whatis width

    type = double

    (gdb) p width

    $4 = 13

    (gdb) set width=47

    Invalid syntax in expression.

    因为,set width是gdb的命令,所以,出现了Invalid syntax in expression的设置错误。此时,可以使用set var命令来告诉gdb,width不是gdb的参数,而是程序的变量名,如:

    (gdb) set var width=47    

    另外,还可能有些情况,gdb并不报告这种错误。所以保险起见,在改变程序变量取值时,最好都使用set var格式的gdb命令。   

    2. 跳转执行

    一般来说,被调试程序会按照程序代码的运行顺序依次执行。gdb提供了乱序执行的功能,也就是说,gdb可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由gdb的jump命令来实现:

    jump <linespec>

    指定下一条语句的运行点。<linespce>可以是文件的行号,可以是file:line格式,可以是+num这种偏移量格式。表示下一条运行语句从哪里开始。

     

    jump <address>

    这里的<address>是代码行的内存地址。

    注意:

    jump命令不会改变当前的程序栈中的内容,所以,从一个函数跳到另一个函数时,当函数运行完返回进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序Core Dump。所以最好是在同一个函数中进行跳转。

    熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以,jump命令也就是改变了这个寄存器中的值。可以使用set $pc来更改跳转执行的地址。如: 

    set $pc = 0x485

    3. 产生信号量

    使用singal命令可以产生一个信号量给被调试的程序。如中断信号Ctrl+C。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用gdb产生一个信号量。精确地在某处产生信号非常有利程序的调试。

    其语法是:

    signal <singal>

    Linux的系统信号量通常从1到15。所以<singal>的取值也在这个范围。

    signal命令和shell的kill命令不同,系统的kill命令发信号给被调试程序时,是由gdb截获的,而signal命令所发出的信号则是直接发给被调试程序的。

    4. 强制函数返回

        如果调试断点在某个函数中,还有语句没有执行完,可以使用return命令强制函数忽略还没有执行的语句并返回。

    return

    return <expression>

    使用return命令取消当前函数的执行,并立即返回。如果指定了<expression>,那么该表达式的值会被当作函数的返回值。

    5. 强制调用函数

        call <expr>

    表达式中也可以是函数,以达到强制调用函数的目的,显示函数的返回值,如果函数返回值是void,那么就不显示。

    另一个相似的命令也可以完成这一功能——print。print后面可以跟表达式,所以也可以用它来调用函数。print和call的不同之处是,如果函数返回void,call则不显示,print则显示函数返回值,并把该值存入历史数据中。

    6. 在不同语言中使用gdb

    gdb支持下列语言:C、C++、Fortran、PASCAL、Java、Chill、assembly 和 Modula-2。一般来说,gdb会根据所调试的程序来确定所用的调试语言。比如:发现文件名后缀为.c的,gdb会认为是C程序;文件名后缀为.C、.cc、.cp、.cpp、.cxx、.c++的,gdb会认为是C++程序;后缀是.f, .F的,gdb会认为是Fortran程序;后缀为.s、.S的会认为是汇编语言。

    也就是说,gdb会根据所调试的程序的语言,来设置自己的语言环境,并让gdb的命令跟着语言环境的改变而改变。比如一些gdb命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如,C/C++中对指针的语法是*p,而在Modula-2中则是p^。并且,如果当前的程序是由几种不同语言一同编译成的,到调试过程中,gdb也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,确实是一种体贴开发人员的设计。

    下面是几个关于gdb语言环境的命令:

    show language

    查看当前的语言环境。如果gdb不能识别所调试的编程语言,那么,C语言被认为是默认的环境。

    info frame

    查看当前函数的程序语言。

    info source

    查看当前文件的程序语言。

    如果gdb没有检测出当前的程序语言,那么用户也可以手动设置当前的程序语言。使用set language命令即可做到。

    如果set language命令后什么也不跟,可以查看gdb所支持的语言种类:   

    (gdb) set language

    The currently understood settings are:

     

    local or auto    Automatic setting based on source file

    c              Use the C language

    c++             Use the C++ language

    asm             Use the Asm language

    fortran        Use the Fortran language

    java            Use the Java language

    modula-2       Use the Modula-2 language

    pascal                  Use the Pascal language

    scheme                 Use the Scheme language

    可以在set language后加上被列出来的程序语言名,来设置当前的语言环境。

    gdb是一个强大的命令行调试工具。大家知道命令行的强大在于,其可以形成执行序列,形成脚本。Linux下的软件以命令行的较多,这给程序开发提供了极大的便利。命令行软件的优势在于,它们可以非常容易地集成在一起,使用几个简单的已有工具的命令,就可以实现一个非常强大的功能。

     因此Linux下的软件比Windows下的软件更能有机地结合,各自发挥长处,组合起来具有更为强大的功能。而Windows下的图形软件基本上是各自为营,互相不能调用,很不利于各种软件的相互集成。这里并不是要和Windows作个什么比较,所谓“寸有所长,尺有所短”,图形化工具还是有不如命令行的地方。

     

     

    第5章 使用 make

    make是一个解释makefile文件中的指令的命令工具。一般来说,大多数的IDE都有这个命令,比如DelphimakeVisual C++nmakeLinuxGNUmake

    什么是makefile文件?make命令执行时,需要一个 makefile文件,以告诉make命令需要怎样去编译和连接程序。或许很多Windows程序员都不知道这个工具,因为那些WindowsIDE都没有提供该功能。作一个专业的程序员尤其是作为Linux下的程序员,要进行Linux下的软件编程,理解makefile文件是必需的,因为会不会写makefile文件,直接关系到是否具备完成大型工程的能力,makefile文件关系到了整个工程的编译规则。这就好像尽管现在有很多HTML编辑器,但如果想成为一个专业网页设计师,还需要了解HTML标识的含义一样。

    一个工程中的源文件数量很多,其按类型、功能、模块分别放在若干个目录中,makefile文件定义了一系列的规则来指定哪些文件需要先编译,哪些文件需要后编译,哪些文件需要重新编译,甚至进行更复杂的操作。makefile文件就像一个Shell脚本,其中也可以执行操作系统的命令。makefile文件带来的好处是——自动化编译,一旦写好,只需要一个make命令,就可自动编译整个工程,极大地提高了软件开发的效率。

    5.1 makefile实例文件分析

    本部分将用一个示例来说明如何建立一个makefile文件,以便给大家一个感性认识。这个示例来源于GNUmake使用手册,工程中有8C文件和3个头文件,要写一个makefile文件来告诉make命令如何编译和连接这几个文件。makefile文件的操作规则是:

    ●       如果这个工程没有编译过,所有C文件都要编译并被连接。

    ●       如果这个工程的某几个C文件被修改,只需编译被修改的C文件,并连接目标程序。

    ●       如果这个工程的头文件被改变了,需要编译引用了这几个头文件的C文件,并连接目标程序。

    只要makefile文件写得足够好,所有的这一切,只用一个make命令就可以完成,make命令会自动智能地根据当前文件的修改情况来确定哪些文件需要重新编译,从而自动编译所需要的文件并连接目标程序。

    在讲述这个makefile文件之前,还是先来粗略地看一看下面的代码:

    target ... : prerequisites ...

    command

    ...

    ...

    上面的代码中target是一个目标文件可以是Object 文件也可以是执行文件还可以是一个标签(Label)。对于标签的特性,在5.3.5节中讲解。

    prerequisites是要生成的target所需要的文件或是目标。

    commandmake需要执行的命令(任意的Shell命令)

    这是一个文件的依赖关系,target这一个或多个的目标文件依赖于prerequisites中的文件,其生成规则定义在command中。prerequisites中如果有一个以上的文件比target文件更新的话,command所定义的命令就会执行。这就是makefile文件的规则,也就是makefile文件中最核心的内容。下面结合实例作详细说明。

    5.1.1 makemakefile文件的关系

    下面通过一个实例来讲述makemakefile文件的关系。

    实例5-1是一个完整的makefile文件,在一个工程中有3个头文件和8C文件,其中应用到了前面讲述的3个规则。

    实例5-1

     

     

    edit : main.o kbd.o command.o display.o /

               insert.o search.o files.o utils.o

                gcc -o edit main.o kbd.o command.o display.o /

                           insert.o search.o files.o utils.o

        main.o : main.c defs.h

                gcc -c main.c

        kbd.o : kbd.c defs.h command.h

                gcc -c kbd.c

        command.o : command.c defs.h command.h

                gcc -c command.c

        display.o : display.c defs.h buffer.h

                gcc -c display.c

        insert.o : insert.c defs.h buffer.h

                gcc -c insert.c

        search.o : search.c defs.h buffer.h

                gcc -c search.c

        files.o : files.c defs.h buffer.h command.h

                gcc -c files.c

        utils.o : utils.c defs.h

                gcc -c utils.c

        clean :

                rm edit main.o kbd.o command.o display.o /

                   insert.o search.o files.o utils.o

     

    提示:

    反斜杠/是换行符的意思。这样使makefile文件更易读。可以把这个内容保存在makefile文件makefile文件夹的文件中,然后在该目录下直接输入命令make,就可以生成执行文件edit。如果要删除执行文件和所有的中间目标文件,只要简单地执行一下make clean就可以了。

    在这个makefile文件中,目标文件(target)包含如下内容:执行文件edit和中间目标文件(*.o);依赖文件(prerequisites),即冒号后面的那些 .c 文件和 .h文件。每一个 .o 文件都有一组依赖文件,而这些 .o 文件又是执行文件edit的依赖文件。依赖关系的实质是说明目标文件由哪些文件生成,换言之,目标文件是哪些文件更新的结果。在定义好依赖关系后,后续的代码定义了如何生成目标文件的操作系统命令,其一定要以一个Tab键作为开头。

    提示:

    make并不管命令是怎么工作的,它只管执行所定义的命令。make会比较targets文件和prerequisites文件的修改日期,如果prerequisites文件的日期比targets文件的日期要新,或者target不存在,make就会执行后续定义的命令。另外,clean不是一个文件,它只不过是一个动作名字,有点像C语言中的lable一样,冒号后什么也没有,这样make就不会自动去找文件的依赖性,也就不会自动执行其后所定义的命令。要执行其后的命令,就要在make命令后明显地指出这个lable的名字。这样的方法非常有用,可以在一个makefile文件中定义不用的编译或是和编译无关的命令,比如程序的打包或备份等。

    在默认方式下,只输入make命令。其会做如下工作:

    make会在当前目录下找名字为“makefile文件”或“makefile文件夹”的文件。如果找到,它会找文件中的第一个目标文件(target)。在上面的例子中,它会找到edit这个文件,并把这个文件作为最终的目标文件;如果edit文件不存在,或是edit所依赖的后面的 .o 文件的修改时间要比edit这个文件新,它就会执行后面所定义的命令来生成edit文件。

    如果edit所依赖的.o文件也存在,make会在当前文件中找目标为.o文件的依赖性,如果找到,则会根据规则生成.o文件(这有点像一个堆栈的过程)。

    当然,C文件和H文件如果存在,make会生成 .o 文件,然后再用 .o 文件生成make的最终结果,也就是执行文件edit。

    这就是整个make的依赖性,make会一层又一层地去找文件的依赖关系,直到最终编译出第一个目标文件。在找寻的过程中,如果出现错误,比如最后被依赖的文件找不到,make就会直接退出,并报错。而对于所定义的命令的错误,或是编译不成功,make就不会处理。如果在make找到了依赖关系之后,冒号后面的文件不存在,make仍不工作。

    通过上述分析,可以看出像clean这样没有被第一个目标文件直接或间接关联时,它后面所定义的命令将不会被自动执行,不过,可以显式使make执行。即使用命令make clean,以此来清除所有的目标文件,并重新编译。

    在编程中,如果这个工程已被编译过了,当修改了其中一个源文件时,比如file.c,根据依赖性,目标file.o会被重新编译(也就是在这个依赖性关系后面所定义的命令),则file.o文件也是最新的,即file.o文件的修改时间要比edit要新,所以edit也会被重新连接了。而如果改变了command.hkdb.ocommand.ofiles.o都会被重新编译,并且edit会被重新连接。

    5.1.2 makefile文件中使用变量

    在上面的例子中,先通过实例5-2来看看edit的规则。

    实例5-2

     

     

    edit : main.o kbd.o command.o display.o /

                      insert.o search.o files.o utils.o

                gcc -o edit main.o kbd.o command.o display.o /

                           insert.o search.o files.o utils.o

    可以看到,[.o]文件的字符串被重复了两次。如果这个工程需要加入一个新的[.o]文件,需要在两个位置插入(实际是3个位置,还有一个位置在clean)。当然,这个makefile文件并不复杂,所以在两个位置加就可以了。但如果makefile文件变得复杂,就要在第3个位置插入,该位置容易被忘掉,从而会导致编译失败。所以,为了makefile文件的易维护,在makefile文件中可以使用变量。makefile文件的变量也就是一个字符串,可以理解成C语言中的宏。比如,声明一个变量objects,在makefile文件一开始可以这样定义,见实例5-3

    实例5-3

     

     

    objects = main.o kbd.o command.o display.o /

                  insert.o search.o files.o utils.o

    于是就可以很方便地在makefile文件中以$(objects)的方式来使用这个变量了。改良版的makefile文件就变成实例5-4的样子

    实例5-4

     

     

    objects = main.o kbd.o command.o display.o /

                  insert.o search.o files.o utils.o

        edit : $(objects)

                gcc -o edit $(objects)

        main.o : main.c defs.h

                gcc -c main.c

        kbd.o : kbd.c defs.h command.h

                gcc -c kbd.c

        command.o : command.c defs.h command.h

                gcc -c command.c

        display.o : display.c defs.h buffer.h

                gcc -c display.c

        insert.o : insert.c defs.h buffer.h

                gcc -c insert.c

        search.o : search.c defs.h buffer.h

                gcc -c search.c

        files.o : files.c defs.h buffer.h command.h

                gcc -c files.c

        utils.o : utils.c defs.h

                gcc -c utils.c

        clean :

                rm edit $(objects)

    如果有新的.o文件加入,只需简单地修改一下objects变量就可以了。

    5.1.3 让make自动推导依赖关系

    GNUmake功能很强大,它可以自动推导文件以及文件依赖关系后面的命令,此时就没有必要在每一个[.o]文件后都写上类似的命令,因为make会自动识别,并自己推导命令。

    只要make看到一个.o文件,它就会自动把[.c]文件加在依赖关系中;如果make找到whatever.o,则whatever.c就会成为whatever.o的依赖文件。并且 gcc -c whatever.c 也会被推导出来,于是,makefile文件再也不用写得太复杂,可以简化为实例5-5

    实例5-5

     

     

    objects = main.o kbd.o command.o display.o /

                  insert.o search.o files.o utils.o

        edit : $(objects)

                gcc -o edit $(objects)

        main.o : defs.h

        kbd.o : defs.h command.h

        command.o : defs.h command.h

        display.o : defs.h buffer.h

        insert.o : defs.h buffer.h

        search.o : defs.h buffer.h

        files.o : defs.h buffer.h command.h

        utils.o : defs.h

        .PHONY : clean

        clean :

                rm edit $(objects) 

    这种方法也就是make隐晦规则。上面的文件内容中,.PHONY表示clean是个伪目标文件。

    5.1.4 另类风格的makefile文件

    即然make可以自动推导命令,则可以将过多的[.o][.h]进行简化,删除重复的[.h],结果如实例5-6

    实例5-6

     

     

    objects = main.o kbd.o command.o display.o /

                  insert.o search.o files.o utils.o

        edit : $(objects)

               gcc -o edit $(objects)

        $(objects) : defs.h

        kbd.o command.o files.o : command.h

        display.o insert.o search.o files.o : buffer.h

        .PHONY : clean

        clean :

                rm edit $(objects)

     

    注意

    这种风格让makefile文件变得很简单,但文件依赖关系就显得有点凌乱了。鱼和熊掌不可得兼,所以并不推荐这种风格,一是文件的依赖关系看不清楚,二是文件一多,要加入几个新的.o文件,那就更不清楚了。

    5.1.5 清空目标文件的规则

    每个makefile文件中都应该写一个清空目标文件(.o和执行文件)的规则,这不仅便于重新编译,也很利于保持文件的清洁。一般的风格如下:

    实例5-7

     

     

    clean:

                rm edit $(objects)

    更为稳健的做法是:

    实例5-8

     

     

    .PHONY : clean

            clean :

                    -rm edit $(objects)

    前面说过,.PHONY表示clean是一个伪目标,而在rm命令前面加了一个小减号的目的是,如果某些文件出现问题将被忽略,继续进行后面的操作。当然,clean的规则不要放在文件的开头,否则会变成make的默认目标。不成文的规矩是clean从来都放在文件的最后

    上面讲述的实例是一个makefile文件的概貌,也是编写一般makefile文件的基础。

    5.2 makefile文件概述

    makefile文件主要包含了5部分内容:显式规则、隐式规则、变量定义、文件指示和注释。

    ●       显式规则。显式规则说明了如何生成一个或多个目标文件。这要由makefile文件的创作者指出,包括要生成的文件、文件的依赖文件、生成的命令。

    ●       隐式规则。由于make有自动推导的功能,所以隐式的规则可以比较粗糙地简略书写makefile文件,这是由make所支持的。

    ●       变量定义。在makefile文件中要定义一系列的变量,变量一般都是字符串,这有点儿像C语言中的宏。当makefile文件执行时,其中的变量都会扩展到相应的引用位置上。

    ●       文件指示。其包括3个部分,一个是在一个makefile文件中引用另一个makefile文件,就像C语言中的include一样;另一个是指根据某些情况指定makefile文件中的有效部分,就像C语言中的预编译#if一样;还有就是定义一个多行的命令。

    ●       注释。makefile文件中只有行注释,和UNIX的Shell脚本一样,其注释用“#”字符,这个就像C/C++中的“/* */”和“//”一样。如果要在makefile文件中使用“#”字符,可以用反斜框进行转义,如:“/#”。

    技巧:

    makefile文件中的命令必须要以[Tab]键开始。

    默认情况下,make命令会在当前目录下按顺序找寻文件名为GNUmakefile文件Makefile文件makefile文件的文件,找到后解释这个文件。在这3个文件名中,最好使用makefile文件这个文件名。最好不要用GNUmakefile文件,这个文件是GNUmake识别的。注意,一些makeMakefile文件文件名不敏感,但是大多数的make都支持Makefile文件makefile文件这两种默认文件名。当然,可以使用别的文件名来书写makefile文件,比如:Make.LinuxMake.SolarisMake.AIX等。如果要指定特定的makefile文件,可以使用make-f--file参数,如:make -f Make.Linux。命令如下:

    [david@DAVID david]$ make -f makelinux

    makefile文件中使用include关键字可以把别的makefile文件包含进来这类似于C语言的#include被包含的文件会保持原来状态并放在当前文件的包含位置。include的语法是:

        include <filename>

    filename可以是当前操作系统Shell的文件模式(可以保含路径和通配符)。在include前面可以有一些空字符但是绝不能以[Tab]键开始。include<filename>可以用一个或多个空格隔开。举个例子,有这样几个makefile文件:a.mkb.mkc.mk,还有一个文件叫foo.make,以及一个变量$(bar),其包含了e.mkf.mk,下面的语句:

    include foo.make *.mk $(bar)

    等价于:

    include foo.make a.mk b.mk c.mk e.mk f.mk

    make命令开始时会找寻include所指出的其他makefile文件并把其内容安置在当前的位置就好像C/C++#include指令一样。如果文件都没有指定绝对路径或相对路径,make会在当前目录下首先寻找,如果当前目录下没有找到,make还会在下面的几个目录下寻找:

    ●       如果make执行时,有-I或--include-dir参数,make就会在这个参数所指定的目录下去寻找。

    ●       如果目录<prefix>/include(一般是:/usr/local/bin或/usr/include)存在,make也会去找。

    如果有文件没有找到,make会生成一条警告信息,但不会马上出现致命错误。它会继续载入其他文件,一旦完成makefile文件的读取,make会再重试这些没有找到或是不能读取的文件,如果还是不行,make才会出现一条致命信息。如果想让make不理那些无法读取的文件,而继续执行,可以在include前加一个减号。如:

    -include <filename>

    这表示,无论include过程中出现什么错误,都不会报错而是继续执行。和其他版本make兼容的相关命令是sinclude,其作用和inculde相同。

    如果当前环境中定义了环境变量MAKEFILESmake会把这个变量中的值作一个类似于include的动作。这个变量中的值是其他的makefile文件,用空格分隔。只是它和include不同的是,从这个环境变量中引入的makefile文件的目标不会起作用,如果环境变量中定义的文件发现错误,make也会忽略。

    在这里建议不要使用这个环境变量,因为只要这个变量一旦被定义,当使用make时,所有的makefile文件都会受到它的影响,这绝不是希望看到的结果。此处是为了提醒大家,也许有时候makefile文件出现了问题,此时可以看看当前环境中有没有定义这个变量。

    GNUmake工作时的执行步骤如下:

    (1) 读入所有的makefile文件。

    (2) 读入被include包括的其他makefile文件。

    (3) 初始化文件中的变量。

    (4) 推导隐式规则,并分析所有规则。

    (5) 为所有的目标文件创建依赖关系链。

    (6) 根据依赖关系,决定哪些目标要重新生成。

    (7) 执行生成命令。

    (1)(5)步为第一个阶段,(6)(7)为第二个阶段。第一个阶段中,如果定义的变量被使用了,make会把其在使用的位置展开。但make并不会马上完全展开,make使用的是拖延战术,如果变量出现在依赖关系的规则中,仅当这条依赖被决定要使用了,变量才会在其内部展开。

    5.3 make书写规则

    make书写规则包含两个部分,一个是依赖关系,一个是生成目标的方法。在makefile文件中,规则的顺序是很重要的。因为makefile文件中只应该有一个最终目标,其他的目标都是被这个目标所连带出来的,所以一定要让make知道最终目标是什么。一般来说,定义在makefile文件中的目标可能会有很多,但是第一条规则中的目标将被确立为最终的目标。make所完成的也就是这个目标。

    5.3.1 规则举例

    实例5-9

     

     

    foo.o : foo.c defs.h       # foo模块

          gcc -c -g foo.c

    看到这个例子,应该不是很陌生了,前面也已说过,foo.o是目标,foo.cdefs.h是目标所依赖的源文件,此处可使用命令gcc -c -g foo.c (Tab键开头)。这个规则说明两件事:

    ●       文件的依赖关系。foo.o依赖于foo.c和defs.h文件,如果foo.c和defs.h文件的日期比foo.o文件的日期新,或者foo.o不存在,则发生依赖关系。

    ●       如果生成(或更新)foo.o文件,要用到gcc命令。

    5.3.2 在规则中使用通配符

    如果想定义一系列比较类似的文件,很自然地就想起使用通配符。make支持3种通配符:*?[...]。波浪号(~)字符在文件名中也有比较特殊的用途。如果是~/test,就表示当前用户的$HOME目录下的test目录。而~hchen/test则表示用户hchen的宿主目录下的test目录(这些都是Linux下的常识,make也支持)。而在Windows或是MS-DOS下,用户没有宿主目录,波浪号所指的目录则根据环境变量HOME而定。

    通配符代替了一系列的文件,如*.c表示后缀为c的文件。一个需要注意的是,如果文件名中有通配符,如*,可以用转义字符/,如/*来表示真实的*字符,而不是任意长度的字符串。

    下面还是先来看几个例子:

    实例5-10

     

     

    clean:

       rm -f *.o

    实例5-10是操作系统Shell所支持的通配符。这是在命令中的通配符。

    实例5-11

     

     

    print: *.c

    lpr -p $?

    touch print

    实例5-11说明了通配符也可以在规则中,目标print依赖于所有的[.c]文件。其中的$?是一个自动化变量,将会在后面作详细介绍。

    实例5-12

     

     

    objects = *.o

    实例5-12表示了,通配符同样可以用在变量中。makefile文件中的变量其实就是C/C++中的宏。如果要让通配符在变量中展开,也就是让objects的值成为所有[.o]的文件名的集合,可以像实例5-13这样:

    实例5-13

     

     

    objects := $(wildcard *.o)

    这种用法由关键字wildcard指出。

    5.3.3 文件搜寻

    在一些大的工程中,有大量的源文件,通常的做法是把这许多的源文件分类,并存放在不同的目录中。所以,当make需要去找寻文件的依赖关系时,可以在文件前加上路径,但最好的方法是把一个路径告诉make,让make自动去找。makefile文件中的特殊变量VPATH就是完成这个功能的。如果没有指明这个变量,make只会在当前的目录中去找寻依赖文件和目标文件;如果定义了这个变量,make就会在当前目录找不到的情况下,到所指定的目录中去找寻文件。

    实例5-14

    VPATH = src:../headers

    实例5-14的定义指定两个目录:src../headersmake会按照这个顺序进行搜索。目录由冒号分隔(当然,当前目录永远是最高优先搜索的位置)。另一个设置文件搜索路径的方法是使用makevpath关键字(注意,它是全小写的),这不是变量,这是一个make的关键字,而这和上面提到的那个VPATH变量很类似,但是它更为灵活。它可以指定不同的文件在不同的搜索目录中。这是一个很灵活的功能,它的使用方法有三种:

    ●       vpath <pattern> <directories>

    为符合模式<pattern>的文件指定搜索目录<directories>

    ●       vpath <pattern>

    清除符合模式<pattern>的文件搜索目录。

    ●       vpath

    清除所有已被设置好了的文件搜索目录。

    vapth使用方法中的<pattern>需要包含%字符。%的意思是匹配一个以上的字符,例如,%.h表示所有以.h结尾的文件。<pattern>指定了要搜索的文件集,而<directories>则指定了<pattern>的文件集的搜索目录。例如实例5-15

    实例5-15

    vpath %.h ../headers    

    该语句表示,要求make../headers目录下搜索所有以.h结尾的文件(如果某文件在当前目录没有找到的话)。可以连续地使用vpath语句,以指定不同搜索策略。如果连续的vpath语句中出现了相同的<pattern>,或是被重复了的<pattern>make会按照vpath语句的先后顺序来执行搜索。如实例5-16

     

    实例5-16

    vpath %.c foo

    vpath %   blish

    vpath %.c bar

    其表示.c结尾的文件先在foo目录然后在blish目录最后在bar目录中进行搜索。

    实例5-17

    vpath %.c foo:bar

    vpath %   blish

    实例5-17的语句则表示.c结尾的文件先在foo目录然后在bar目录最后才在blish目录中进行搜索。

    5.3.4 伪目标

    在前面的例5-1中,提到过一个clean的目标,这是一个伪目标

    实例5-18

    clean:

    rm *.o temp

    正像前面例子中的clean一样,既然生成了许多编译文件,也应该提供一个清除它们的目标以备完整地重新编译时用(make clean来使用该目标)。因为并不生成clean这个文件,伪目标并不是一个文件,只是一个标签。由于伪目标不是文件,所以make无法生成它的依赖关系和决定它是否要执行,只有通过显式地指明这个目标才能让其生效。当然,伪目标的取名不能和文件名重名,不然其就失去了伪目标的意义了。

    为了避免和文件重名这种情况,可以使用一个特殊的标记.PHONY来显式地指明一个目标是伪目标,向make说明不管是否有这个文件,这个目标就是伪目标

    PHONY : clean

    只要有这个声明,不管是否有clean文件,要运行clean这个目标,整个过程可以这样写:

    .PHONY: clean

    clean:

         rm *.o temp

    伪目标一般没有依赖的文件,但是,也可以为伪目标指定所依赖的文件。伪目标同样可以作为默认目标,只要将其放在最前面即可。比如,如果makefile文件需要连续生成若干个可执行文件,而只想简单地输入一个make就让其执行,并且所有的目标文件都写在一个makefile文件中,可以使用伪目标这个特性,如实例5-19

    实例5-19

    all : prog1 prog2 prog3

        .PHONY : all

      prog1 : prog1.o utils.o

                gcc -o prog1 prog1.o utils.o

     prog2 : prog2.o

                gcc -o prog2 prog2.o

     prog3 : prog3.o sort.o utils.o

                gcc -o prog3 prog3.o sort.o utils.o

    makefile文件中的第1个目标会被作为其默认目标,声明了一个all的伪目标,其依赖于其他3个目标。由于伪目标的特性是总会被执行,所以其依赖的那3个目标就总不如all这个目标新。所以,其他3个目标的规则总是会被采纳,也就达到了一下子生成多个目标的目的。.PHONY : all声明了all这个目标为伪目标

    从实例5-19可以看出,目标也可以成为依赖关系。所以,伪目标同样也可成为依赖关系,如实例5-20

    实例5-20

    .PHONY: cleanall cleanobj cleandiff

        cleanall : cleanobj cleandiff

                rm program

        cleanobj :

                rm *.o

        cleandiff :

                rm *.diff

    make clean将清除所有需要被清除的文件。cleanobjcleandiff这两个伪目标有点像子程序的意思。可以输入make cleanallmake cleanobj以及make cleandiff命令来达到清除不同种类文件的目的。

    5.3.5 多目标

    makefile文件规则中的目标可以不止一个,其支持多目标。有可能多个目标同时依赖于一个文件,并且其生成的命令大体类似,于是就能把其合并起来。当然,多个目标的生成规则的执行命令是同一个,这可能会带来麻烦,不过可以使用一个自动化变量$@。这个变量表示目前规则中所有目标的集合,这样说可能很抽象,如实例5-21

     

    实例5-21

    bigoutput littleoutput : text.g

    generate text.g -$(subst output,,$@) > $@

    上述规则等价于实例5-22

    实例5-22

    bigoutput : text.g

    generate text.g -big > bigoutput

    littleoutput : text.g

    generate text.g -little > littleoutput

    其中-$(subst output$@)中的$表示执行一个makefile文件的函数函数名为subst后面的为参数。$@表示目标的集合,就像一个数组,$@依次取出目标,并执行命令。

    5.3.6 静态模式

    静态模式可以更加容易地定义多目标的规则,可以让规则变得更加灵活和有弹性。语法如下:

    实例5-23

    <targets ...>: <target-pattern>: <prereq-patterns ...>

              <commands>

              ...

    ●       targets定义了一系列的目标文件,可以有通配符,表示目标的一个集合。

    ●       target-pattern指明了targets的模式,也就是目标集模式。

    ●       prereq-patterns是目标的依赖模式,它对target-pattern形成的模式再进行一次依赖目标的定义。

    如果<target-pattern>定义成%.o,表示<target>集合中都是以.o结尾的;而如果<prereq-patterns>定义成%.c,表示对<target-pattern>所形成的目标集进行二次定义。其计算方法是,取<target-pattern>模式中的%(也就是去掉了扩展符[.o]),并为其加上扩展符[.c],从而形成新的集合。

    所以,目标模式或是依赖模式中都应该有%这个字符,如果文件名中有%,可以使用反斜杠/进行转义,以标明真实的%字符。

    看一个例子:

    实例5-24

    objects = foo.o bar.o

    all: $(objects)

    $(objects): %.o: %.c

    $(gcc) -c $(CFLAGS) $< -o $@

    实例5-24指明了目标从$object中获取%.o代表所有以.o结尾的目标也就是foo.o bar.o即变量$object集合的模式而依赖模式%.c则取模式%.o%也就是foo bar并为其加上.c的后缀于是依赖目标就是foo.c bar.c。而命令中的$<$@是自动化变量,$<表示所有的依赖目标集(也就是foo.c bar.c)$@表示目标集(也就是foo.o bar.o)。于是,上面的规则展开后等价于实例5-25的规则:

    实例5-25

    foo.o : foo.c

       $(gcc) -c $(CFLAGS) foo.c -o foo.o

    bar.o : bar.c

       $(gcc) -c $(CFLAGS) bar.c -o bar.o

    试想,如果“%.o”有几百个,只要用这种很简单的“静态模式规则”就可以写完一堆规则,简化多了。“静态模式规则”的用法很灵活,如果用得好,将是一个很强大的功能。再看一个例子:

    实例5-26

     files = foo.elc bar.o lose.o

        $(filter %.o,$(files)): %.o: %.c

                $(gcc) -c $(CFLAGS) $< -o $@

        $(filter %.elc,$(files)): %.elc: %.el

                emacs -f batch-byte-compile $<

    $(filter %.o,$(files))表示调用makefile文件的filter函数过滤$filter这个例子展示了makefile文件更大的弹性。

    5.3.7  自动生成依赖性

    makefile文件中,依赖关系可能会需要包含一系列的头文件,比如,如果main.c中有一句#include "defs.h",依赖关系应该是:

    main.o : main.c defs.h

    但是,如果是一个比较大型的工程,必须清楚哪些C文件包含了哪些头文件,并且,在加入或删除头文件时,也需要小心地修改makefile文件,这是一项繁琐的工作。为了避免这种繁琐而又容易出错的工作,可以使用GCC的一个-MM的选项,即自动寻找源文件中包含的头文件,并生成一个依赖关系。例如,如果执行下面的命令:

    gcc -M main.c

    其输出是:

    main.o : main.c defs.h

    于是由编译器自动生成依赖关系,而不必再手动书写若干文件的依赖关系,并由编译器自动生成。

    编译器的这个功能如何与makefile文件联系在一起呢?因为makefile文件也要根据这些源文件重新生成,让makefile文件自已依赖于源文件。这样并不现实,不过可以用其他手段来迂回地实现这一功能。GNU组织建议把编译器为每一个源文件自动生成的依赖关系放到一个文件中,为每一个name.c的文件都生成一个name.dmakefile文件,.d文件中就存放了对应.c文件的依赖关系。

    于是,可以写出.c文件和.d文件的依赖关系,让make自动更新或生成.d文件,并把其包含在主makefile文件中,就可以自动地生成每个文件的依赖关系了。这里,给出了一个模式规则来产生.d文件:

    %.d: %.c

          @set -e; rm -f $@; /

          $(gcc) -M $(CPPFLAGS) $< > $@.$$$$; /

          sed 's,/($*/)/.o[ :]*,/1.o $@ : ,g' < $@.$$$$ > $@; /

          rm -f $@.$$$$

    这个规则的意思是所有的.d文件依赖于.c文件。rm -f $@的意思是删除所有的目标也就是.d文件。第二行的意思是,为每个依赖文件$<,也就是.c文件生成依赖文件,$@表示模式%.d文件,如果有一个C文件是name.c%就是name$$$$意为一个随机编号,第2行生成的文件有可能是name.d.12345,第3行使用sed命令作了一个替换,第4行就是删除临时文件。

    总之,这个模式要做的事就是在编译器生成的依赖关系中加入.d文件的依赖,即把依赖关系:

    main.o : main.c defs.h

    转成:

    main.o main.d : main.c defs.h

    于是,.d文件也会自动更新,并会自动生成。当然,在这个.d文件中加入的不只是依赖关系,生成的命令也可一并加入,让每个[.d]文件都包含一个完赖的规则。一旦完成这个工作,接下来就要把这些自动生成的规则放进主makefile文件中。可以使用makefile文件的include命令来引入别的makefile文件(前面讲过),例如:

    sources = foo.c bar.c

    include $(sources:.c=.d)

    上述语句$(sources:.c=.d)中的.c=.d的意思是作一个替换把变量$(sources)中所有[.c]的字串都替换成[.d]关于这个替换的内容在后面会有更为详细的讲述。当然,使用时应注意次序,因为include是按次序来载入文件,最先载入的[.d]文件中的目标会成为默认目标。

    5.4 使用命令

    每条规则中的命令和操作系统Shell的命令行是一致的。make会按顺序一条一条地执行命令,每条命令必须以[Tab]键开头,除非命令紧跟在依赖规则后面的分号后。在命令行之间的空格或是空行会被忽略,但是如果该空格或空行是以Tab键开头的,make会认为其是一个空命令,除非特别指定一个其他的Shellmakefile文件中,#是注释符,很像C/C++中的//,其后的本行字符都视为注释。

    5.4.1 显示命令

    通常,make会把其要执行的命令行在命令执行前输出到屏幕上。当在命令行前用@字符时,这个命令将不被make显示出来。最具代表性的例子是,用这个功能向屏幕显示一些信息。如:

    @echo 正在编译XXX模块......

    当执行make时,会输出正在编译XXX模块……字串,但不会输出命令。如果没有@make将输出:

    echo 正在编译XXX模块......

    正在编译XXX模块......

    如果make执行时,带入make参数-n--just-print,其只是显示命令,但不会执行命令。这个功能有利于调试makefile文件,可预览书写的命令的运行顺序及结果。make参数-s--slient表示全面禁止命令的显示。

    5.4.2 执行命令

    当依赖目标新于目标时,也就是当规则的目标需要更新时,make会一条一条地执行其后的命令。需要注意的是,如果要让上一条命令的结果应用在下一条命令上,应该使用分号分隔这两条命令。比如第一条命令是cd命令,希望第二条命令在cd之后的基础上运行,就不能把这两条命令写在两行上,而应该把这两条命令写在一行上,用分号分隔。如

    示例一:

    exec:

       cd /home/hchen

         pwd

    示例二

    exec:

        cd /home/hchen; pwd

    当执行make exec第一个例子中的cd没起作用pwd会打印出当前的makefile文件目录而第二个例子中cd就起作用了pwd会打印出/home/hchen

    5.4.3 命令出错

    每当命令运行完后,make会检测每个命令的返回码。如果命令返回成功,make会执行下一条命令,当规则中所有的命令成功返回后,这个规则就算是成功完成了。如果一个规则中的某个命令出错了(命令退出码非零)make就会终止执行当前规则,这将有可能终止所有规则的执行。

    有些时候,命令的出错并不表示就是错误的。例如,mkdir命令用于建立一个目录,如果目录不存在,mkdir就成功执行,万事大吉;如果目录存在,就会出错。在使用mkdir时,不希望因mkdir出错而终止规则的运行。此时就要忽略命令的出错信息,此时可以在makefile文件中的命令行前加一个减号-(Tab键之后),则此时不管命令是否出错,都认为是成功的,如实例5-27

    实例5-27

    clean:

          -rm -f *.o

     还有一个办法是make加上-i或是--ignore-errors参数这样makefile文件中的所有命令都会忽略错误。而如果一个规则是以.IGNORE作为目标的,这个规则中的所有命令都将会忽略错误。这些是不同级别的防止命令出错的方法,可以根据自己的需要设置。

    还有需要提一下的make参数是-k或是--keep-going,这个参数的意思是,如果某规则中的命令出错了,就终止该规则的执行,但继续执行其他规则。

    5.4.4 嵌套执行make

    在一些大的工程中,会将不同模块及不同功能的源文件放在不同的目录中,可以在每个目录中都书写一个该目录的makefile文件,这有利于让makefile文件变得更加简洁,而不至于把所有的东西全部写在一个makefile文件中,这样维护makefile文件时会变得困难。这个技术对于模块编译和分段编译有非常大的好处。

    例如,有一个子目录叫subdir,这个目录下有个makefile文件,来指明这个目录下文件的编译规则。总控的makefile文件可以这样书写:

    subsystem:

       cd subdir && $(MAKE)

    其等价于

    subsystem:

       $(MAKE) -C subdir

    定义$(MAKE)宏变量是因为,也许make需要一些参数,所以定义成一个变量比较利于维护。这两个例子的意思都是先进入subdir目录,然后执行make命令。

    把这个makefile文件叫做总控makefile文件,总控makefile文件的变量可以传递到下级的makefile文件中(如果显式地声明),但是不会覆盖下层的makefile文件中所定义的变量,除非指定了-e参数。

    如果要传递变量到下级makefile文件中,可以使用这样的声明:

    export <variable ...>

    如果不想让某些变量传递到下级makefile文件中,可以这样声明:

    unexport <variable ...>

    示例一:

    export variable = value

    其等价于

    variable = value

    export variable

    等价于:

    export variable := value

    等价于:

    variable := value

    export variable

    示例二

    export variable += value

    其等价于

    variable += value

    export variable

    如果要传递所有的变量,只要一个export就行了。后面什么也不用跟,表示传递所有的变量。

    需要注意的是,有两个变量,一个是SHELL,一个是MAKEFLAGS,这两个变量不管是否进行输出,其总是要传递到下层makefile文件中。特别是MAKEFILES变量,其中包含了make的参数信息,如果执行总控makefile文件时有make参数或是在上层makefile文件中定义了这个变量,MAKEFILES变量将会是这些参数,并会传递到下层makefile文件中,这是一个系统级的环境变量。

    但是make命令中有几个参数并不往下传递,它们是-C-f-h-o-W。如果不想往下层传递参数,可以这样写:

    subsystem:

    cd subdir && $(MAKE) MAKEFLAGS=

    如果定义了环境变量MAKEFLAGS,确信其中的选项是大家都会用到的。如果其中有-t-n-q参数,将会有意想不到的结果。

    还有一个在嵌套执行中比较有用的参数,-w或是--print-directory会在make执行的过程中输出一些信息,并看到目前的工作目录。比如,如果下级make目录是/home/hchen/gnu/make,如果使用make -w来执行,当进入该目录时,会看到:

    make: Entering directory '/home/hchen/gnu/make'.

    而在完成下层make后离开目录时,会看到:

    make: Leaving directory '/home/hchen/gnu/make'

    当使用-C参数来指定make下层makefile文件时,-w会自动打开。如果参数中有-s (--slient)或是--no-print-directory-w总是失效的。

    5.4.5 定义命令包

    如果makefile文件中出现一些相同命令序列,可以为这些相同的命令序列定义一个变量。定义这种命令序列的语法以define开始,以endef结束,如:

    实例5-28

    define run-yacc

     yacc $(firstword $^)

       mv y.tab.c $@

    endef

    这里run-yacc是这个命令包的名字其不要和makefile文件中的变量重名。在defineendef中的两行就是命令序列。这个命令包中的第一个命令是运行Yacc程序,因为Yacc程序总是生成y.tab.c的文件,所以第二行的命令就是把这个文件改个名字。还是把这个命令包放到一个实例5-29中来看一下效果。

    实例5-29

    foo.c : foo.y

           $(run-yacc)

    可以看见,要使用这个命令包,就好像使用变量一样。在这个命令包的使用中,命令包run-yacc中的$^就是foo.y$@就是foo.cmake在执行命令包时,命令包中的每个命令会依次独立执行。

    5.5 使用变量

    makefile文件中定义的变量,就像是C/C++语言中的宏一样,它代表了一个文本字串,在makefile文件中执行的时候,其会自动原样展开在所使用的位置。其与C/C++所不同的是,可以在makefile文件中改变其值。在makefile文件中,变量可以使用在目标、依赖目标、命令或是makefile文件的其他部分中。变量的命名字可以包含字符、数字、下划线(可以是数字开头),但不应该含有:#=或是空字符(空格、回车等)

    变量是大小写敏感的,fooFooFOO3个不同的变量名。传统的makefile文件的变量名是全大写的命名方式,但推荐使用大小写搭配的变量名,如MakeFlags。这样可以避免因与系统的变量冲突而导致意外的事情。

    有一些变量是很奇怪的字串,如$<$@等,这些是自动化变量。

    5.5.1 变量的基础

    变量在声明时需要给予初值,而在使用时,需要在变量名前加上$符号,但最好用小括号()或是大括号{}把变量包括起来。如果要使用真实的$字符,需要用$$来表示。变量可以使用在许多位置,如规则中的目标、依赖、命令以及新的变量中。先看实例5-30

    实例5-30

    objects = program.o foo.o utils.o

        program : $(objects)

               gcc -o program $(objects)

        $(objects) : defs.h

    变量会在使用它的位置精确地展开就像C/C++中的宏一样。例如

    实例5-31

    foo = c

        prog.o : prog.$(foo)

                $(foo)$(foo) -$(foo) prog.$(foo)

    展开后得到:

    prog.o : prog.c

    gcc -c prog.c

    当然,千万不要在makefile文件中这样使用,这里只是举个例子来表明makefile文件中的变量在使用处展开的真实样子。可见其就是一个替代作用。另外,给变量加上括号完全是为了更加安全地使用这个变量,在上面的例子中,如果不想给变量加上括号也可以,但还是强烈建议给变量加上括号,因为这样可使代码更清晰。

    5.5.2 赋值变量

    在定义变量的值时,可以使用其他变量来构造变量的值,在makefile文件中有两种方式可以用变量定义变量的值。

    先看第一种方式,也就是简单地使用=号,在=左侧是变量,右侧是变量的值,右侧变量的值可以定义在文件的任何一处,也就是说,右侧中的变量不一定非要是已定义好的值,其也可以使用后面定义的值。如实例5-32

    实例5-32

    foo = $(bar)

        bar = $(ugh)

        ugh = Huh?

        all:

                echo $(foo)

    执行make all将会打出变量$(foo)的值是Huh?($(foo)的值是$(bar)$(bar)的值是$(ugh)$(ugh)的值是Huh?)。可见,变量是可以使用后面的变量来定义的。

    这个功能有利有弊,好处是可以把变量的真实值推到后面来定义,如:

    CFLAGS = $(include_dirs) -O

        include_dirs = -Ifoo -Ibar

    CFLAGS在命令中被展开时,会是-Ifoo -Ibar -O。但这种形式也有弊端,那就是递归定义,如:

    CFLAGS = $(CFLAGS) -O

    或:

    A = $(B)

    B = $(A)

    这会让make陷入无限的变量展开过程中。当然,make有能力检测这样的定义,并会报错。另外,如果在变量中使用函数,这种方式会让make运行时非常慢,更糟糕的是,它在使用两个make函数wildcardshell时会出现不可预知的错误,因为不会知道这两个函数会被调用多少次。

    为了避免上面的情形,可以使用make中的另一种用变量来定义变量的方法。这种方法使用的是:=操作符,如:

    x := foo

    y := $(x) bar

    x := later

    其等价于:

    y := foo bar

    x := later

    值得一提的是,前面的变量不能使用后面的变量,只能使用前面已定义好了的变量。如果是这样:

    y := $(x) bar

    x := foo

    y的值是bar,而不是foo bar

    上面都是一些比较简单的变量应用。下面来看一个复杂的例子,其中包括了make函数、条件表达式和一个系统变量MAKELEVEL的使用:

    实例5-33

    ifeq (0,${MAKELEVEL})

        cur-dir := $(shell pwd)

        whoami   := $(shell whoami)

        host-type := $(shell arch)

        MAKE := ${MAKE} host-type=${host-type} whoami=${whoami}

        endif

    系统变量MAKELEVEL表示:如果make有一个嵌套执行动作,这个变量会记录当前makefile文件的调用层数。

    请先看一个例子,如果要定义一个变量,其值是一个空格,可以这样处理:

    nullstring :=

        space := $(nullstring) # end of the line

    nullstring是一个Empty变量,不含任何内容,而space的值是一个空格。因为在操作符的右边是很难描述一个空格的,这里采用的技术很管用,先用一个Empty变量来标明变量定义开始,后面再采用#注释符来表示变量定义终止,这样,可以定义出其值是一个空格的变量。请注意这里关于#的使用,注释符#的这种特性值得注意。如果定义一个变量:

    dir := /foo/bar    # directory to put the frobs in

    dir变量的值是/foo/bar后面还跟了4个空格如果使用该变量来指定别的目录——$(dir)/file就会出现不可预期的效果。

    还有一个比较有用的操作符是?=,先看示例:

    实例5-34

    FOO ?= bar 

    其含义是,如果FOO没有被定义过,变量FOO的值就是bar;如果FOO先前被定义过,这条语句将什么也不做,其等价于:

    实例5-35

    If eq ($(origin FOO), undefined)

          FOO = bar

        endif

    5.5.3 变量的高级用法

    这里介绍两种变量的高级使用方法,第一种是变量值的替换。

    可以替换变量中的共有部分,其格式是$(var:a=b)或是${var:a=b}。其意思是,把变量var中所有以a字串结尾的a替换成b字串。这里的结尾意思是空格或是结束符。

    再看一个示例:

    实例5-36

    foo := a.o b.o c.o

        bar := $(foo:.o=.c)

    这个示例中先定义了一个$(foo)变量而第二行的意思是把$(foo)中所有.o扩展符全部替换成.c所以$(bar)的值就是a.c b.c c.c

    另外一种变量替换的技术是以静态模式定义的,如实例5-37

    实例5-37

    foo := a.o b.o c.o

        bar := $(foo:%.o=%.c)

    这依赖于被替换字串中是否有相同的模式,模式中必须包含一个%字符,这个例子同样让$(bar)变量的值变为a.c b.c c.c

    2种高级用法是把变量的值再当成变量。如实例5-38

    实例5-38

    x = y

        y = z

        a := $($(x))

    在这个例子中$(x)的值是y所以$($(x))就是$(y)于是$(a)的值就是z (注意x=y而不是x=$(y))

    还可以使用更多的层次:

    实例5-39

    x = y

        y = z

        z = u

        a := $($($(x)))

    这里的$(a)的值是u,相关的推导留给读者自己去做。

    再复杂一点,使用上在变量定义中使用变量的第1个方式,如实例5-40

      实例5-40

    x = $(y)

        y = z

        z = Hello

        a := $($(x))

    这里的$($(x))被替换成了$($(y))因为$(y)值是z所以最终结果是a:=$(z)也就是Hello

    再复杂一点,再加上一些函数,如实例5-41

    实例5-41

    x = variable1

        variable2 := Hello

        y = $(subst 1,2,$(x))

        z = y

        a := $($($(z)))

    这个例子中,$($($(z)))扩展为$($(y)),而其再次被扩展为$($(subst 1,2,$(x)))$(x)的值是variable1subst函数把variable1中的所有1字串替换成2字串,于是,variable1变成variable2,再取其值。所以,最终$(a)的值就是$(variable2)的值——Hello

    在这种方式中,可以使用多个变量来组成一个变量的名字,然后再取其值:   

    first_second = Hello

        a = first

        b = second

        all = $($a_$b)

    这里的$a_$b组成了first_second于是$(all)的值就是Hello

    再来看看结合第1种技术的例子   

    a_objects := a.o b.o c.o

        1_objects := 1.o 2.o 3.o

        sources := $($(a1)_objects:.o=.c)

    这个例子中如果$(a1)的值是a$(sources)的值就是a.c b.c c.c如果$(a1)的值是1$(sources)的值是1.c 2.c 3.c

    再来看一个这种技术和函数与条件语句一同使用的例子:   

    ifdef do_sort

        func := sort

        else

        func := strip

        endif

        bar := a d b g q c

        foo := $($(func) $(bar))

    这个示例中,如果定义了do_sort, :foo= $(sort a d b g q c),于是$(foo)的值就是a b c d g q。而如果没有定义do_sort, :foo= $(sort a d b g q c),调用的就是strip函数。

    当然,把变量的值再当成变量这种技术,同样可以用在操作符的左边:   

    dir = foo

        $(dir)_sources := $(wildcard $(dir)/*.c)

        define $(dir)_print

        lpr $($(dir)_sources)

        endef

    这个例子中定义了3个变量dirfoo_sourcesfoo_print

    5.5.4 追加变量值

    可以使用+=操作符给变量追加值,如:

    objects = main.o foo.o bar.o utils.o

    objects += another.o

    于是$(objects)值变成main.o foo.o bar.o utils.o another.o (another.o被追加进去了)

    使用+=操作符,可以模拟为下面的这种例子:

    objects = main.o foo.o bar.o utils.o

    objects := $(objects) another.o

    所不同的是,用+=更为简洁。

    如果变量之前没有定义过,+=会自动变成=;如果前面有变量定义,+=会继承于前一次操作的赋值符;如果前一次的是:=+=会以:=作为其赋值符,如:

    variable := value

    variable += more

    等价于

    variable := value

    variable := $(variable) more

    但如果是这种情况:

    variable = value

    variable += more

    由于前次的赋值符是=,所以+=也会以=来作为赋值,这样就会发生变量的递归定义,这是我们不希望看到的。不过make会自动解决这个问题,因此不必担心。

    5.5.5 override 指示符

    如果有变量是make的命令行参数设置的,makefile文件中对这个变量的赋值会被忽略。如果想在makefile文件中设置这类参数的值,可以使用override指示符。其语法是:

    override <variable> = <value>

    override <variable> := <value>

    还可以追加:

    override <variable> += <more text>

    对于多行的变量定义,用define指示符,在define指示符前,也同样可以使用ovveride指示符,如:

    override define foo

        bar

        endef

    5.5.6 多行变量 

    还有一种设置变量值的方法是使用define关键字。使用define关键字设置变量的值可以包括换行符,这有利于定义一系列的命令。

    define指示符后面跟的是变量的名字,而重起一行定义变量的值,定义以endef关键字结束。其工作方式和=操作符一样。变量的值可以包含函数、命令、文字,或是其他变量。因为命令需要以[Tab]键开头,所以如果用define定义的命令变量中没有以[Tab]键开头,make就不会将其作为命令。

    实例5-42展示了define的用法:

      

    实例5-42

    define two-lines

        echo foo

        echo $(bar)

        endef

    5.5.7 环境变量

    make运行时的系统环境变量可以在make开始运行时被载入到makefile文件中,但是如果makefile文件中已定义了这个变量,或者这个变量由make命令行带入,系统的环境变量的值将被覆盖(如果make指定了-e参数,系统环境变量将覆盖makefile文件中定义的变量)

    因此,如果在环境变量中设置了CFLAGS环境变量,就可以在所有的makefile文件中使用这个变量了。这对于使用统一的编译参数有比较大的好处。如果makefile文件中定义了CFLAGS,则会使用makefile文件中的这个变量;如果没有定义,则使用系统环境变量的值,一个共性和个性的统一,很像全局变量局部变量的特性。

    make嵌套调用时,上层makefile文件中定义的变量会以系统环境变量的方式传递到下层的makefile文件中。当然,默认情况下,只有通过命令行设置的变量会被传递。而定义在文件中的变量,如果要向下层makefile文件传递,则需要使用exprot关键字来声明。

    当然,并不推荐把许多变量都定义在系统环境中,这样,在执行不用的makefile文件时,拥有的是同一套系统变量,这可能会带来更多的麻烦。

    5.5.8 目标变量

    前面所讲的在makefile文件中定义的变量都是全局变量,在整个文件中都可以访问这些变量。当然,自动化变量除外,如$<等这种自动化变量属于规则型变量,这种变量的值依赖于规则的目标和依赖目标的定义。当然,同样可以为某个目标设置局部变量,这种变量称为Target-specific Variable,它可以和全局变量同名,因为它的作用范围只在这条规则以及连带规则中,所以其值也只在作用范围内有效。而不会影响规则链以外的全局变量的值。其语法是:

    <target ...> : <variable-assignment>

    <target ...> : overide <variable-assignment>

    <variable-assignment>可以是前面讲过的各种赋值表达式,如=:=+=或是=。第二个语法是针对make命令行带入的变量,或是系统环境变量。

    这个特性非常有用,当设置了这样一个变量,这个变量会作用到由这个目标所引发的所有规则中去。如实例5-43

    实例5-43

    prog : CFLAGS = -g

        prog : prog.o foo.o bar.o

                $(gcc) $(CFLAGS) prog.o foo.o bar.o

        prog.o : prog.c

                $(gcc) $(CFLAGS) prog.c

        foo.o : foo.c

                $(gcc) $(CFLAGS) foo.c

    bar.o : bar.c

                $(gcc) $(CFLAGS) bar.c

    这个示例中不管全局的$(CFLAGS)的值是什么prog目标以及其所引发的所有规则中(prog.o foo.o bar.o的规则)$(CFLAGS)的值都是-g

    5.5.9 模式变量

    在GNU的make中,还支持模式变量(Pattern-specific Variable),通过上面的目标变量,变量可以定义在某个目标上。模式变量的好处就是,可以给定一种模式,可以把变量定义在符合这种模式的所有目标上。

    make的模式一般是至少含有一个“%”的,所以,可以以如下方式给所有以[.o]结尾的目标定义目标变量:

    %.o : CFLAGS = -O

    同样,模式变量的语法和目标变量一样:

    <pattern ...> : <variable-assignment>

    <pattern ...> : override <variable-assignment>

    override同样是针对系统环境传入的变量,或是make命令行指定的变量。

    5.6 使用条件判断

    使用条件判断,可以让make根据运行时的不同情况选择不同的执行分支。条件表达式可以是比较变量的值,或是比较变量和常量的值。

    5.6.1 示例

    下面的例子,判断$(CC)变量是否是gcc,如果是的话,则使用GNU函数编译目标。 

    libs_for_gcc = -lgnu

        normal_libs =

        foo: $(objects)

        ifeq ($(CC),gcc)

                $(CC) -o foo $(objects) $(libs_for_gcc)

        else

                $(CC) -o foo $(objects) $(normal_libs)

        endif

    可见,在上面示例的这个规则中,目标foo可以根据变量$(CC)的值选取不同的函数库来编译程序。

    可以从上面的示例中看到3个关键字:ifeq、else和endif。ifeq表示条件语句的开始,并指定一个条件表达式,表达式包含两个参数,以逗号分隔,表达式以圆括号括起。else表示条件表达式为假的情况。endif表示一个条件语句的结束,任何一个条件表达式都应该以endif结束。

    当变量$(CC)的值是gcc时,目标foo的规则是:   

    foo: $(objects)

              $(CC) -o foo $(objects) $(libs_for_gcc)

    而当变量$(CC)值不是gcc(比如cc),目标foo的规则是: 

    foo: $(objects)

              $(CC) -o foo $(objects) $(normal_libs)

    当然,还可以把上面的那个例子写得更简洁一些,如实例5-44:

    实例5-44

    ibs_for_gcc = -lgnu

        normal_libs =

        ifeq ($(CC),gcc)

          libs=$(libs_for_gcc)

        else

          libs=$(normal_libs)

        endif

        foo: $(objects)

                $(CC) -o foo $(objects) $(libs)

    5.6.2 语法

    条件表达式的语法为:   

    <conditional-directive>

        <text-if-true>

        endif

    以及

    <conditional-directive>

        <text-if-true>

        else

        <text-if-false>

        endif

    其中<conditional-directive>表示条件关键字,如ifeq。这个关键字有4个。第一个是前面所见过的ifeq:

    ifeq (<arg1>, <arg2>)

        ifeq '<arg1>' '<arg2>'

        ifeq "<arg1>" "<arg2>"

        ifeq "<arg1>" '<arg2>'

        ifeq '<arg1>' "<arg2>"

    比较参数arg1和arg2的值是否相同。当然,参数中还可以使用make的函数。如:   

    ifeq ($(strip $(foo)),)

        <text-if-empty>

        endif

    这个示例中使用了strip函数,如果这个函数的返回值是空(Empty),<text-if-empty>就生效。

    第2个条件关键字是ifneq。语法是:   

    ifneq (<arg1>, <arg2>)

        ifneq '<arg1>' '<arg2>'

        ifneq "<arg1>" "<arg2>"

        ifneq "<arg1>" '<arg2>'

        ifneq '<arg1>' "<arg2>"

    其比较参数arg1和arg2的值是否相同,如果不同,则为真。

    第3个条件关键字是ifdef。语法是:

    ifdef <variable-name>

    如果变量<variable-name>的值非空,那么表达式为真;否则,表达式为假。当然,<variable-name>同样可以是一个函数的返回值。注意,ifdef只是测试一个变量是否有值,其并不会把变量扩展到当前位置。还是来看两个例子:

    实例5-45

    示例一:

    bar =

        foo = $(bar)

        ifdef foo

        frobozz = yes

        else

        frobozz = no

        endif

    示例二:

        foo =

        ifdef foo

        frobozz = yes

        else

        frobozz = no

        endif

    实例5-46

        foo =

        ifdef foo

        frobozz = yes

        else

        frobozz = no

        endif

    实例5-45$(frobozz)值是yes实例5-46则是no

    4个条件关键字是ifndef。其语法是:

    ifndef <variable-name>

    这个和ifdef是相反的意思。在<conditional-directive>这一行上,多余的空格是允许的,但是不能以[Tab]键作为开始(不然就被认为是命令)。而注释符“#”同样也是安全的。else和endif也一样,只要不是以[Tab]键开始就行了。

    注意:

    make在读取makefile文件时就计算条件表达式的值,并根据条件表达式的值来选择语句,所以,最好不要把自动化变量(如$@等)放入条件表达式中,因为自动化变量是在运行时才有的。而且,为了避免混乱,make不允许把整个条件语句分成两部分放在不同的文件中。

    5.7 使用函数

    在makefile文件中可以使用函数来处理变量,从而让命令或是规则更为灵活和智能化。make所支持的函数不是很多,不过已经足够使用了。函数调用后,函数的返回值可以当作变量来使用。

    5.7.1 函数的调用语法

    函数调用很像变量的使用,也是以“$”来标识的,其语法如下:  

    $(<function> <arguments>)

    或是:   

    i ${<function> <arguments>}

    这里,<function>就是函数名,make支持的函数不多。<arguments>是函数的参数,参数间以逗号“,”分隔,而函数名和参数之间以“空格”分隔。函数调用以“$”开头,以圆括号或花括号把函数名和参数括起。

    感觉很像一个变量,是不是?函数中的参数可以使用变量。为了风格的统一,函数和变量的括号最好一样,如使用$(subst a,b,$(x))这样的形式,而不是$(subst a,b,${x})的形式。因为统一会更清楚,也会减少一些不必要的麻烦。还是来看一个例子:

    实例5-47

    comma:= ,

        empty:=

        space:= $(empty) $(empty)

        foo:= a b c

        bar:= $(subst $(space),$(comma),$(foo))

    在这个示例中,$(comma)的值是一个逗号。$(space)使用了$(empty)定义了一个空格,$(foo)的值是“a b c”。$(bar)的定义,调用了函数subst,这是一个替换函数,这个函数有3个参数:第1个参数是被替换字串,第2个参数是替换字串,第3个参数是替换操作用的字串。这个函数也就是把$(foo)中的空格替换成逗号,所以$(bar)的值是“a,b,c”。

    5.7.2 字符串处理函数

    ●       $(subst <from>,<to>,<text>)

    名称:字符串替换函数——subst。

    功能:把字串<text>中的<from>字符串替换成<to>

    返回:函数返回被替换过后的字符串。

    示例:       

    $(subst ee,EE,feet on the street)       

    把feet on the street中的ee替换成EE,返回结果是fEEt on the strEEt。

    ●       $(patsubst <pattern>,<replacement>,<text>)

    名称:模式字符串替换函数——patsubst。

    功能:查找<text>中的单词(单词以空格、Tab键或回车、换行符分隔)是否符合模式<pattern>,如果匹配的话,则以<replacement>替换。这里,<pattern>可以包括通配符“%”,表示任意长度的字串。如果<replacement>中也包含“%”,<replacement>中的这个“%”将是<pattern>中的那个“%”所代表的字串 (可以用“/”来转义,以“/%”来表示真实含义的“%”字符)。

    返回:函数返回被替换过后的字符串。

    示例:

    $(patsubst %.c,%.o,x.c.c bar.c)

    把字串x.c.c bar.c符合模式[%.c]的单词替换成[%.o],返回结果是x.c.o bar.o。

    这和前面变量章节说过的相关知识有点相似。如:

    $(var:<pattern>=<replacement>)

    相当于

    $(patsubst <pattern>,<replacement>,$(var))

    $(var: <suffix>=<replacement>)

    则相当于

    $(patsubst %<suffix>,%<replacement>,$(var))

    例如有:

    objects = foo.o bar.o baz.o,

    “$(objects:.o=.c)”和“$(patsubst %.o,%.c,$(objects))”是一样的。

    $(strip <string>)

    名称:去空格函数——strip

    功能:去掉<string>字串中开头和结尾的空字符。

    返回:返回被去掉空格的字符串值。

    示例:       

    $(strip a b c )

    把字串 a b c 去掉开头和结尾的空格结果是a b c

    $(findstring <find>,<in>)

    名称:查找字符串函数——findstring。

    功能:在字串<in>中查找<find>字串。

    返回:如果找到,返回<find>,否则返回空字符串。

    示例:

    $(findstring a,a b c)

    $(findstring a,b c)

    第一个函数返回a字符串,第二个返回“”字符串(空字符串)

    ●       $(filter <pattern...>,<text>)

    名称:过滤函数——filter

    功能:以<pattern>模式过滤<text>字符串中的单词,保留符合模式<pattern>的单词。可以有多个模式。

    返回:返回符合模式<pattern>的字串。

    示例:

    sources := foo.c bar.c baz.s ugh.h

    foo: $(sources)

    cc $(filter %.c %.s,$(sources)) -o foo

    $(filter %.c %.s,$(sources)) 返回的值是“foo.c bar.c baz.s”。

    $(filter-out <pattern...>,<text>)

    名称:反过滤函数——filter-out

    功能:以<pattern>模式过滤<text>字符串中的单词,去除符合模式<pattern>的单词。可以有多个模式。

    返回:返回不符合模式<pattern>的字串。

    示例:

    objects=main1.o foo.o main2.o bar.o

    mains=main1.o main2.o       

    $(filter-out $(mains),$(objects)) 返回值是“foo.o bar.o”。       

    $(sort <list>)

    名称:排序函数——sort。

    功能:给字符串<list>中的单词排序(升序)

    返回:返回排序后的字符串。

    示例:

    $(sort foo bar lose) 返回“bar foo lose” 。

     

    备注:

    sort函数会去掉<list>中相同的单词。

    $(word <n>,<text>)

    名称:取单词函数——word

    功能:取字符串<text>中的第<n>个单词(从一开始)

    返回:返回字符串<text>中的第<n>个单词。如果<n><text>中的单词数要大,返回空字符串。

    示例:

    $(word 2, foo bar baz) 返回值是“bar”。

    $(wordlist <s>,<e>,<text>) 

    名称:取单词串函数——wordlist

    功能:从字符串<text>中取从<s>开始到<e>的单词串。<s><e>是一个数字。

    返回:返回字符串<text>中从<s><e>的单词字串。如果<s><text>中的单词数要大,返回空字符串;如果<e>大于<text>的单词数,返回从<s>开始,到<text>结束的单词串。

    示例:

    $(wordlist 2, 3, foo bar baz) 返回值是“bar baz”。

    $(words <text>)

    名称:单词个数统计函数——words。

    功能:统计<text>中字符串中的单词个数。

    返回:返回<text>中的单词数。

    示例:

    $(words, foo bar baz) 返回值是“3”。

    备注:

    如果要取<text>中最后的一个单词,可以这样:$(word $(words <text>),<text>)。

    $(firstword <text>)。

    名称:首单词函数——firstword。

    功能:取字符串<text>中的第一个单词。

    返回:返回字符串<text>的第一个单词。

    示例:

    $(firstword foo bar) 返回值是“foo”。

    备注:

    这个函数可以用word函数来实现:$(word 1,<text>)。

    以上是所有的字符串操作函数,如果搭配使用,可以完成比较复杂的功能。这里,举一个现实中应用的例子。make使用VPATH变量来指定依赖文件的搜索路径。于是,可以利用这个搜索路径来指定编译器对头文件的搜索路径参数CFLAGS,如:

    override CFLAGS += $(patsubst %,-I%,$(subst:, ,$(VPATH)))

    如果$(VPATH)的值是src:../headers,$(patsubst %,-I%,$(subst :, ,$(VPATH)))将返回-Isrc -I../headers,这正是cc或gcc搜索头文件路径的参数。

    5.7.3 文件名操作函数

    下面要介绍的函数主要是处理文件名的,每个函数的参数字符串都会被当做一个或是一系列的文件名来对待。

    $(dir <names...>)

    名称:取目录函数——dir。

    功能:从文件名序列<names>中取出目录部分。目录部分是指最后一个反斜杠“/”之前的部分。如果没有反斜杠,返回“./”。

    返回:返回文件名序列<names>的目录部分。

    示例:

    $(dir src/foo.c hacks)返回值是“src/ ./”。

    $(notdir <names...>)

    名称:取文件函数——notdir。

    功能:从文件名序列<names>中取出非目录部分。非目录部分是指最后一个反斜杠“/”之后的部分。

    返回:返回文件名序列<names>的非目录部分。

    示例:

    $(notdir src/foo.c hacks)返回值是“foo.c hacks”。

    $(suffix <names...>)    

    名称:取后缀函数——suffix。

    功能:从文件名序列<names>中取出各个文件名的后缀。

    返回:返回文件名序列<names>的后缀序列,如果文件没有后缀,则返回空字串。

    示例:

    $(suffix src/foo.c src-1.0/bar.c hacks)返回值是“.c .c”。

    ●       $(basename <names...>)

    名称:取前缀函数——basename。

    功能:从文件名序列<names>中取出各个文件名的前缀部分。

    返回:返回文件名序列<names>的前缀序列,如果文件没有前缀,则返回空字串。

    示例:

    $(basename src/foo.c src-1.0/bar.c hacks) 返回值是“src/foo src-1.0/bar

    hacks”。

    $(addsuffix <suffix>,<names...>)

    名称:加后缀函数——addsuffix。

    功能:把后缀<suffix>加到<names>中的每个单词后面。

    返回:返回加过后缀的文件名序列。

    示例:

    $(addsuffix .c,foo bar) 返回值是“foo.c bar.c”。

    $(addprefix <prefix>,<names...>)

    名称:加前缀函数——addprefix。

    功能:把前缀<prefix>加到<names>中的每个单词后面。

    返回:返回加过前缀的文件名序列。

    示例:

    $(addprefix src/,foo bar) 返回值是“src/foo src/bar”。

    $(join <list1>,<list2>)

    名称:连接函数——join。

    功能:把<list2>中的单词对应地加到<list1>的单词后面。如果<list1>的单词个数比<list2>多,<list1>中多出来的单词将保持原样。如果<list2>的单词个数比<list1>多,<list2>中多出来的单词将被复制到<list2>中。

    返回:返回连接过后的字符串。

    示例:

    $(join aaa bbb , 111 222 333)  返回值是“aaa111 bbb222 333”。

    5.7.4 foreach 函数

    foreach函数和别的函数不同。因为这个函数是用来做循环用的,makefile文件中的foreach函数几乎是仿照Unix标准Shell(/bin/sh)中的for语句,或是C-Shell(/bin/csh)中的foreach语句而构建的。它的语法是: 

    $(foreach <var>,<list>,<text>)

    这个函数的意思是,把参数<list>中的单词逐一取出放到参数<var>所指定的变量中,然后再执行<text>所包含的表达式。每一次<text>会返回一个字符串,循环过程中,<text>所返回的每个字符串会以空格分隔,最后当整个循环结束时,<text>所返回的每个字符串所组成的整个字符串(以空格分隔)将会是foreach函数的返回值。所以,<var>最好是一个变量名,<list>可以是一个表达式,而<text>中一般会使用<var>这个参数来依次枚举<list>中的单词。如实例5-48:

     

    实例5-48

    names := a b c d

        files := $(foreach n,$(names),$(n).o)

    上面的例子中,$(name)中的单词会被挨个取出,并存到变量n中,$(n).o每次根据$(n)计算出一个值,这些值以空格分隔,最后作为foreach函数的返回,所以,$(files)的值是“a.o b.o c.o d.o”。

     注意:

     foreach中的<var>参数是一个临时的局部变量,foreach函数执行完后,参数<var>的变量将不再起作用,其作用域只在foreach函数当中。

    5.7.5 if 函数 

    if函数很像GNU的make所支持的条件语句——ifeq(参见前面章节所述),if函数的语法是:  

    $(if <condition>,<then-part>)

    或是

    $(if <condition>,<then-part>,<else-part>)

    可见,if函数可以包含else部分,或是不含。即if函数的参数可以是两个,也可以是3个。<condition>参数是if的表达式,如果其返回的为非空字符串,这个表达式就相当于返回真,于是,<then-part>会被执行,否则<else-part>会被执行。

    而if函数的返回值是,如果<condition>为真(非空字符串),那个<then-part>会是整个函数的返回值;如果<condition>为假(空字符串),<else-part>会是整个函数的返回值,此时如果<else-part>没有被定义,整个函数返回空字符串。所以,<then-part>和<else-part>只会有一个被执行。

    5.7.6 call函数 

    call函数是惟一一个可以用来创建新的参数化的函数。可以写一个非常复杂的表达式,这个表达式中,可以定义许多参数,然后可以用call函数来向这个表达式传递参数。其语法是:

    $(call <expression>,<parm1>,<parm2>,<parm3>...)

    当make执行这个函数时,<expression>参数中的变量,如$(1),$(2),$(3)等,会被参数<parm1>,<parm2>,<parm3>依次取代。而<expression>的返回值就是call函数的返回值。例如:

    实例5-49

    reverse = $(1) $(2)

        foo = $(call reverse,a,b)

    foo的值就是“a b”。当然,参数的次序是可以自定义的,不一定是顺序的。如实例5-50:

    实例5-50

    reverse = $(2) $(1)

        foo = $(call reverse,a,b)

    此时,foo的值就是“b a”。

    5.7.7 origin函数

    origin函数不像其他的函数,它并不操作变量的值,它只是告诉这个变量是哪里来的。其语法是:

    $(origin <variable>) 

     

    注意:

    <variable>是变量的名字,不应该是引用。所以最好不要在<variable>中使用“$”字符。

    Origin函数会以其返回值来告诉这个变量的出生情况。下面是origin函数的返回值:

    ●       undefined

    如果<variable>从来没有定义过,origin函数返回值为undefined。

    ●       default

    如果<variable>是一个默认的定义,比如CC这个变量,这种变量将在后面讲述。

    ●       environment

    如果<variable>是一个环境变量,并且当makefile文件被执行时,-e参数没有被打开。

    ●       file

    如果<variable>这个变量被定义在makefile文件中。

    ●       command line

    如果<variable>这个变量是被命令行定义的。

    ●       override

    如果<variable>是被override指示符重新定义的。

    ●       automatic

    如果<variable>是一个命令运行中的自动化变量(关于自动化变量将在后面讲述)。

    这些信息对于编写makefile文件是非常有用的。例如,假设有一个makefile文件,其包了一个定义文件Make.def,在Make.def中定义了一个变量bletch,而环境中也有一个环境变量bletch,此时,可判断一下,如果变量来源于环境,就把它重定义了,如果来源于Make.def或是命令行等非环境的,就没有重新定义它。于是,在makefile文件中,可以这样写:

    实例5-51

    ifdef bletch

        ifeq "$(origin bletch)" "environment"

        bletch = barf, gag, etc.

        endif

        endif

    当然,使用override关键字不就可以重新定义环境中的变量了吗?为什么需要使用这样的步骤?是的,用override是可以达到这样的效果,可是override同时会把从命令行定义的变量也覆盖了。这里只想重新定义环境传来的,而不想重新定义命令行传来的。

    5.7.8 shell函数

    shell函数也不像其他函数。顾名思义,它的参数应该是操作系统Shell的命令。也就是说,shell函数把执行操作系统命令后的输出作为函数返回。于是,可以用操作系统命令以及字符串处理命令awk,sed等命令来生成一个变量,如: 

    contents := $(shell cat foo)

    files := $(shell echo *.c)

     

    注意:

    这个函数会新生成一个Shell程序来执行命令,所以要注意其运行性能。如果makefile文件中有一些比较复杂的规则,并大量使用了这个函数,对于系统性能是有害的。特别是makefile文件的隐式规则可能会让shell函数执行的次数比想象的多得多。

    5.7.9 控制make的函数      

    make提供了一些函数来控制make的运行。通常,需要检测一些运行makefile文件时的运行时信息,并且根据这些信息来决定是让make继续执行,还是停止。

    $(error <text ...>)

    产生一个致命的错误,<text ...>是错误信息。注意,error函数不会在一被使用时就产生错误信息,所以如果把其定义在某个变量中,并在后续的脚本中使用这个变量,也是可以的。例如:

    实例5-52

    ifdef ERROR_001

        $(error error is $(ERROR_001))

        endif

    实例5-53

    ERR = $(error found an error!)

        .PHONY: err

        err: ; $(ERR)

    例5-52会在变量ERROR_001定义后执行时产生error调用,而示例5-53则在目录err被执行时才发生error调用。

     $(warning <text ...>)

    这个函数很像error函数,它并不会让make退出,只是输出一段警告信息,而make继续执行。

    5.8 make 的运行

    一般来说,最简单的就是直接在命令行下输入make命令,make命令会查找当前目录的makefile文件来执行,一切都是自动的。但有时也许只想让make重编译某些文件,而不是整个工程。而有时候有几套编译规则,以便在不同的时候使用不同的编译规则。本节就讲述如何使用make命令。

    5.8.1 make的退出码

    make命令执行后有3个退出码:

    ●       0 表示成功执行。

    ●       1 如果make运行时出现错误,其返回值为1。

    ●       2 如果使用了make的-q选项,并且make使得一些目标不需要更新,返回2。

    5.8.2 指定makefile文件

    前面说过,GNU make找寻默认的makefile文件的规则是在当前目录下依次找3个文件——GNUmakefile文件、Makefile文件和makefile文件。其按顺序找这3个文件,一旦找到,就开始读取这个文件并执行。

    当然,也可以给make命令指定一个特殊名字的makefile文件。要实现这个功能,需要使用make的-f或是--file参数(--makefile文件参数也行)。例如,有一个makefile文件的名字是hchen.mk,可以这样让make来执行这个文件:

    make –f hchen.mk 

    如果在make的命令行中不只一次地使用了-f参数,所有指定的makefile文件将会被连在一起传递给make执行。

    5.8.3 指定目标

    一般来说,make的最终目标是makefile文件中的第一个目标,而其他目标一般是由这个目标连带出来的,这是make的默认行为。当然,一般来说,makefile文件中的第一个目标由许多目标组成,可以指示make,让其完成所指定的目标。要实现这一目的很简单,只要在make命令后直接跟目标的名字就可以完成(如前面提到的make clean形式)。

    任何在makefile文件中的目标都可以被指定成终极目标,但是除了以“-”打头,或是包含了“=”的目标。因为有这些字符的目标,会被解析成命令行参数或是变量。甚至没有被明确写出来的目标也可以成为make的终极目标。也就是说,只要make可以找到其隐含推导规则,这个隐含目标同样可以被指定成终极目标。

    有一个make的环境变量叫MAKECMDGOALS,这个变量中会存放所指定的终极目标的列表,如果在命令行上没有指定目标,这个变量是空值。这个变量可以使用在一些比较特殊的情形下。如实例5-54:

    实例5-54

    sources = foo.c bar.c

        ifneq ( $(MAKECMDGOALS),clean)

        include $(sources:.c=.d)

        endif

    基于上面这个例子,只要输入的命令不是make clean,makefile文件会自动包含foo.d和bar.d这两个makefile文件。

    使用指定终极目标的方法可以很方便地编译程序,例如实例5-55

    实例5-55

    PHONY: all

        all: prog1 prog2 prog3 prog4

    从这个例子中可以看到,这个makefile文件中有4个需要编译的程序——prog1、 prog2、prog3和prog4,可以使用make all命令来编译所有的目标(如果把all置成第一个目标,只需执行make),也可以使用make prog2来单独编译目标prog2。

    既然make可以指定所有makefile文件中的目标,也包括“伪目标”,于是可以根据这种性质来让makefile文件根据指定的不同目标来完成不同的事。在Linux中,软件发布时,特别是GNU这种开放源代码的软件发布时,其makefile文件都包含了编译、安装、打包等功能。可以参照这种规则来书写makefile文件中的目标。

    下面说明一些常用的伪目标的功能。

    ●        all   这个伪目标是所有目标的目标,其功能一般是编译所有的目标。

    ●       clean  这个伪目标功能是删除所有被make创建的文件。

    ●       install  这个伪目标功能是安装已编译好的程序,其实就是把目标执行文件复 制到指定的目标中去。

    ●       print   这个伪目标的功能是列出改变过的源文件。

    ●       tar  这个伪目标的功能是把源程序打包备份。也就是一个tar文件。

    ●       dist  这个伪目标的功能是创建一个压缩文件,一般是把tar文件压成Z文件, 或是gz文件。

    ●       TAGS  这个伪目标用于更新所有的目标,以备完整地重编译使用。

    ●       check和test 这两个伪目标一般用来测试makefile文件的流程。

    当然,一个项目的makefile文件中也不一定要书写这样的目标,这些都是GNU的内容。如果makefile文件中有这些功能,一是很实用,二是可以使makefile文件显得很专业。

    5.8.4 检查规则

    有时候,不想让makefile文件中的规则执行,只想检查一下命令,或是执行的序列。于是可以使用make命令的下述参数:

    -n

    --just-print

    --dry-run

    --recon

    不执行makefile中的参数,这些参数只是打印命令,不管目标是否更新,把规则和连带规则下的命令打印出来,但不执行,这些参数对于调试makefile文件很有用处。

    -t

    --touch

    这个参数是把目标文件的时间更新,但不更改目标文件。也就是说,make假装编译目标,但不是真正编译目标,只是把目标变成已编译过的状态。

    -q

    --question

    这个参数的行为是找目标,如果目标存在,其什么也不会输出,当然也不会执行编译;如果目标不存在,其会打印出一条出错信息。

    -W <file>

    --what-if=<file>

    --assume-new=<file>

    --new-file=<file>

    这个参数需要指定一个文件,一般是源文件(或依赖文件),make会根据规则推导来运行依赖于这个文件的命令。一般来说,可以和-n参数一同使用,来查看这个依赖文件所发生的规则命令。

    另外一个很有意思的用法是结合-p和-v来输出makefile文件被执行时的信息(该内容将在后面讲述)。

    5.8.5 make的参数

    下面列举了所有GNU make 3.80版的参数定义。其他版本和其他厂商的make大同小异,不过其他厂商的make的具体参数还是请参考各自的产品文档。

    -b

    -m

    这两个参数的作用是忽略和其他版本make的兼容性。

    -B

    --always-make

    认为所有的目标都需要更新(重编译)。

    -C <dir>

    --directory=<dir>

    指定读取makefile文件的目录。如果有多个-C参数,make的解释是后面的路径以前面的路径作为相对路径,并以最后的目录作为被指定目录。如:

    make –C ~hchen/test –C prog

    等价于

    make –C ~hchen/test/prog。

    --debug[=<options>]

    输出make的调试信息。它有几种不同的级别可供选择,如果没有参数,那就是输出最简单的调试信息。下面是<options>的取值:

    ●       a 也就是all,输出所有的调试信息。

    ●       b 也就是basic,只输出简单的调试信息。即输出不需要重编译的目标。

    ●       v 也就是verbose,在b选项的级别之上。输出的信息包括哪个makefile文件被解析,不需要被重编译的依赖文件(或是依赖目标)等。

    ●       i 也就是implicit,输出所有的隐含规则。

    ●       j 也就是jobs,输出执行规则中命令的详细信息,如命令的PID、返回码等。

    ●       m 也就是makefile文件,输出make,读取makefile文件,更新makefile文件,执行makefile文件的信息。

    -d

    相当于“--debug=a”。

    -e

    --environment-overrides

    指明环境变量的值,覆盖makefile文件中定义的变量的值。

    -f=<file>

    --file=<file>

    --makefile文件=<file>

    指定需要执行的makefile文件。

    -h

    --help

    显示帮助信息。

    -i

    --ignore-errors

    在执行时忽略所有的错误。

    -I <dir>

    --include-dir=<dir>

    指定一个包含makefile文件的搜索目标。可以使用多个-I参数来指定多个目录。

    -j [<jobsnum>]

    --jobs[=<jobsnum>]

    指定同时运行命令的个数。如果没有这个参数,make运行命令时能运行多少就运行多少。如果有一个以上的-j参数,仅最后一个-j才是有效的 (注意这个参数在MS-DOS中是无用的)。

    -k

    --keep-going

    出错也不停止运行。如果生成一个目标失败了,依赖于其上的目标就不会被执行。

    -l <load>

    --load-average[=<load]

    --max-load[=<load>]

    指定make运行命令的负载。

    -n

    --just-print

    --dry-run

    --recon

    仅输出执行过程中的命令序列,但并不执行。

    -o <file>

    --old-file=<file>

    --assume-old=<file>

    不重新生成指定的<file>,即使这个目标的依赖文件比它新。

    -p

    --print-data-base

    输出makefile文件中的所有数据,包括所有的规则和变量。这个参数会让一个简单的makefile文件都输出一堆信息。如果只是想输出信息而不想执行makefile文件,可以使用make -qp命令。如果想查看执行makefile文件前的预设变量和规则,可以使用make –p –f /dev/null。这个参数输出的信息会包含makefile文件的文件名和行号,所以,用这个参数来调试的makefile文件很有用,特别是环境变量很复杂的时候。

    -q

    --question

    不运行命令,也不输出。仅仅是检查所指定的目标是否需要更新。如果是0则说明要更新,如果是2则说明有错误发生。

    -r

    --no-builtin-rules

    禁止make使用任何隐式规则。

    -R

    --no-builtin-variabes

    禁止make使用任何作用于变量上的隐式规则。

    -s

    --silent

    --quiet

    在命令运行时不显示命令的输出。

    -S

    --no-keep-going

    --stop

    取消-k选项的作用。因为有些时候,make的选项是从环境变量MAKEFLAGS中继承下来的。所以可以在命令行中使用这个参数来让环境变量中的-k选项失效。

    -t

    --touch

    相当于Linux的touch命令,只是把目标的修改日期变成最新的,也就是阻止生成目标的命令运行。

    -v

    --version

    输出make程序的版本、版权等关于make的信息。

    -w

    --print-directory

    输出运行makefile文件之前和之后的信息。这个参数对于跟踪嵌套式调用make时很有用。

    --no-print-directory

    禁止-w选项。

    -W <file>

    --what-if=<file>

    --new-file=<file>

    --assume-file=<file>

    假定目标<file>需要更新,如果和-n选项使用,这个参数会输出该目标更新时的运行动作。如果没有-n,就像运行UNIX的touch命令一样,使得<file>的修改时间为当前时间。

    --warn-undefined-variables

    只要make发现有未定义的变量,就输出警告信息。

    5.9 隐含规则

    在使用makefile文件时,有一些会经常使用而且使用频率非常高的东西,比如,编译C/C++的源程序为中间目标文件(Linux下是.o文件,Windows下是.obj文件)。本章讲述的就是一些在makefile文件中隐含的,早先约定了的,不需要再写出来的规则。

    隐含规则也就是一种惯例,make会按照这种“惯例”心照不喧地来运行,哪怕makefile文件中没有书写这样的规则。例如,把.c文件编译成.o文件这一规则,根本就不用写出来,make会自动推导出这种规则,并生成需要的.o文件。

    隐含规则会使用一些系统变量,可以改变这些系统变量的值来定制隐含规则运行时的参数。如系统变量CFLAGS可以控制编译时的编译器参数。还可以通过模式规则的方式写下自己的隐含规则。用后缀规则来定义隐含规则会有许多限制。使用模式规则会更加智能和清楚,但后缀规则可以用来保证makefile文件的兼容性。

    了解了隐含规则,可以让其更好地服务,不至于在运行makefile文件时出现一些莫名其妙的东西。当然,任何事物都是矛盾的,“水能载舟,亦可覆舟”,所以,有时候“隐含规则”也会给造成不小的麻烦。只有了解了它,才能更好地使用它。

    5.9.1 使用隐含规则

    如果需要使用隐含规则生成需要的目标,所需要做的就是不要写出这个目标的规则,make会试图去自动推导产生这个目标的规则和命令。如果make可以自动推导生成这个目标的规则和命令,这个行为就是隐含规则的自动推导。当然,隐含规则是make事先约定好的一些东西。例如,有下面的一个makefile文件:

    实例5-56

    foo : foo.o bar.o

              gcc –o foo foo.o bar.o $(CFLAGS) $(LDFLAGS)

    可以注意到,这个makefile文件中并没有写下如何生成foo.o和bar.o这两目标的规则和命令。因为make的隐含规则功能会自动去推导这两个目标的依赖目标和生成命令。

    make会在自己的隐含规则库中寻找可以用的规则,如果找到,就会使用。如果找不到,就会报错。在上面的例子中,make调用的隐含规则是,把.o的目标依赖文件置成.c,并使用C的编译命令cc –c $(CFLAGS) [.c]来生成.o的目标。也就是说,完全没有必要写下下面的两条规则:

    foo.o : foo.c

                gcc –c foo.c $(CFLAGS)

        bar.o : bar.c

             gcc –c bar.c $(CFLAGS)

    因为,这是“约定”好了的事,make已约定好了用C编译器gcc生成.o文件的规则,这就是隐含规则。当然,如果为.o文件书写了自己的规则,make就不会自动推导并调用隐含规则,它会按照写好的规则忠实地执行。

    还有,在make的隐含规则库中,每一条隐含规则都在库中有其顺序,越靠前的则是越经常使用的,所以,这会导致有些时候即使显式地指定了目标依赖,make也不会管。如下面这条规则(没有命令):

    foo.o : foo.p

    依赖文件foo.p (Pascal程序的源文件)有可能变得没有意义。如果目录下存在foo.c文件,隐含规则一样会生效,并会通过foo.c调用C的编译器生成foo.o文件。因为,在隐含规则中,Pascal的规则出现在C的规则之后,所以,make找到可以生成foo.o的C的规则后就不再寻找下一条规则了。如果确实不希望任何隐含规则推导,就不要只写出依赖规则而不写命令。

    5.9.2 隐含规则一览

    这里将讲述所有预先设置(也就是make内建)的隐含规则。如果不明确地写下规则,make就会在这些规则中寻找所需要的规则和命令。当然,也可以使用make的参数-r或--no-builtin-rules选项来取消所有预设置的隐含规则。

    当然,即使指定了-r参数,某些隐含规则还是会生效,因为有许多隐含规则都使用了后缀规则来定义。所以,只要隐含规则中有后缀列表 (也就是系统定义在目标.SUFFIXES的依赖目标),隐含规则就会生效。默认的后缀列表是:.out、.a、.ln、 .o、 .c、 .cc、 .C、 .p、.f、 .F、.r、 .y、 .l、.s、.S、 .mod、 .sym、 .def、.h、.info、 .dvi、 .tex、 .texinfo、 .texi、 .txinfo、.w、.ch、 .web、.sh、.elc、.el。具体的细节会在后面讲述。

    还是先来看一看常用的隐含规则。

    1. 编译C程序的隐含规则

     <n>.o的目标的依赖目标会自动推导为<n>.c,并且其生成命令是$(CC) –c $(CPPFLAGS) $(CFLAGS)。

    2. 编译C++程序的隐含规则

    <n>.o的目标的依赖目标会自动推导为<n>.cc或是<n>.C,并且其生成命令是$(CXX) –c $(CPPFLAGS) $(CFLAGS) (建议使用.cc作为C++源文件的后缀,而不是.C)。

    3. 编译Pascal程序的隐含规则

    <n>.o的目标的依赖目标会自动推导为<n>.p,并且其生成命令是$(PC) –c  $(PFLAGS)。

    4. 编译Fortran/Ratfor程序的隐含规则

    <n>.o的目标的依赖目标会自动推导为<n>.r、<n>.F或<n>.f,并且其生成命令是:

    .f  $(FC) –c  $(FFLAGS)

    .F  $(FC) –c  $(FFLAGS) $(CPPFLAGS)

    .f  $(FC) –c  $(FFLAGS) $(RFLAGS)

    5. 预处理Fortran/Ratfor程序的隐含规则

    <n>.f的目标的依赖目标会自动推导为<n>.r或<n>.F。这个规则只是转换Ratfor或有预处理的Fortran程序到一个标准的Fortran程序。其使用的命令是:

    .F  $(FC) –F $(CPPFLAGS) $(FFLAGS)

    .r               $(FC) –F $(FFLAGS) $(RFLAGS)

    6. 编译Modula-2程序的隐含规则

    <n>.sym的目标的依赖目标会自动推导为<n>.def,并且其生成命令是$(M2C) $(M2FLAGS) $(DEFFLAGS)。

    <n.o> 的目标的依赖目标会自动推导为<n>.mod,并且其生成命令是$(M2C) $(M2FLAGS) $(MODFLAGS)。

    7. 汇编和汇编预处理的隐含规则

    <n>.o 的目标的依赖目标会自动推导为<n>.s,默认使用编译品as,并且其生成命令是$(AS) $(ASFLAGS)。

    <n>.s 的目标的依赖目标会自动推导为<n>.S,默认使用C预编译器cpp,并且其生成命令是$(AS) $(ASFLAGS)。

    8. 链接Object文件的隐含规则

    <n>目标依赖于<n>.o,通过运行C的编译器来运行链接程序生成(一般是ld),其生成命令是$(CC) $(LDFLAGS) <n>.o $(LOADLIBES) $(LDLIBS)。

    这个规则对于只有一个源文件的工程有效,同时也对多个Object文件(由不同的源文件生成)有效。例如如下规则:

             x : y.o z.o

    并且x.c、y.c和z.c都存在时,隐含规则将执行如下命令:

    cc -c x.c -o x.o

    cc -c y.c -o y.o

    cc -c z.c -o z.o

    cc x.o y.o z.o -o x

    rm -f x.o

    rm -f y.o

    rm -f z.o

    如果没有一个源文件(如上例中的x.c)和目标名字(如上例中的x)相关联,最好写出自己的生成规则,不然,隐含规则会报错。

    9. Yacc C程序时的隐含规则

    <n>.c的依赖文件自动推导为n.y (Yacc生成的文件),其生成命令是$(YACC) $(YFALGS) (Yacc是一个语法分析器,关于其细节请查看相关资料)。

    10. Lex C程序时的隐含规则

    <n>.c的依赖文件自动推导为n.l (Lex生成的文件),其生成命令是$(LEX) $(LFALGS) (关于Lex的细节请查看相关资料)。

    11. Lex Ratfor程序时的隐含规则

    <n>.r的依赖文件自动推导为n.l (Lex生成的文件),其生成命令是$(LEX) $(LFALGS)。

    12. 从C程序、Yacc文件或Lex文件创建Lint库的隐含规则

    <n>.ln (lint生成的文件)的依赖文件自动推导为n.c,其生成命令是:$(LINT) $(LINTFALGS) $(CPPFLAGS) -i。

    对于<n>.y和<n>.l也是同样的规则。

    5.9.3 隐含规则使用的变量

    在隐含规则的命令中,基本上都使用了一些预先设置的变量。可以在makefile文件中改变这些变量的值,或是在make的命令行中传入这些值,或是在环境变量中设置这些值。无论怎么样,只要设置了这些特定的变量,其就会对隐含规则起作用。当然,也可以利用make的-R或--no–builtin-variables参数来取消所定义的变量对隐含规则的作用。

    例如,第一条隐含规则——编译C程序的隐含规则的命令是$(CC)–c $(CFLAGS) $(CPPFLAGS)。Make默认的编译命令是cc,如果把变量$(CC)重定义成gcc,把变量$(CFLAGS)重定义成-g,隐含规则中的命令全部会以gcc –c -g $(CPPFLAGS)的样子来执行了。

    可以把隐含规则中使用的变量分成两种:一种是命令相关的,如CC;一种是参数相的关,如CFLAGS。下面是所有隐含规则中会用到的变量。

    1. 关于命令的变量

    ●       AR 函数库打包程序。默认命令是ar。

    ●       AS 汇编语言编译程序。默认命令是as。

    ●       CC C语言编译程序。默认命令是cc。

    ●       CXX C++语言编译程序。默认命令是g++。

    ●       CO 从 RCS文件中扩展文件程序。默认命令是co。

    ●       CPP C程序的预处理器(输出是标准输出设备)。默认命令是$(CC) –E。

    ●       FC Fortran 和 Ratfor 的编译器和预处理程序。默认命令是f77。

    ●       GET 从SCCS文件中扩展文件的程序。默认命令是get。

    ●       LEX Lex方法分析器程序(针对于C或Ratfor)。默认命令是lex。

    ●       PC Pascal语言编译程序。默认命令是pc。

    ●       YACC Yacc文法分析器(针对于C程序)。默认命令是yacc。

    ●       YACCR Yacc文法分析器(针对于Ratfor程序)。默认命令是yacc –r。

    ●       MAKEINFO 转换Texinfo源文件(.texi)到Info文件程序。默认命令是makeinfo。

    ●       TEX 从TeX源文件创建TeX DVI文件的程序。默认命令是tex。

    ●       TEXI2DVI 从Texinfo源文件创建TeX DVI 文件的程序。默认命令是texi2dvi。

    ●       WEAVE 转换Web到TeX的程序。默认命令是weave。

    ●       CWEAVE 转换C Web 到 TeX的程序。默认命令是cweave。

    ●       TANGLE 转换Web到Pascal语言的程序。默认命令是tangle。

    ●       CTANGLE 转换C Web 到 C。默认命令是ctangle。

    ●       RM 删除文件命令。默认命令是rm –f。

    2. 关于命令参数的变量

    下面的这些变量都是上面的命令相关的参数。如果没有指明其默认值,其默认值都是空。

    ●       ARFLAGS 函数库打包程序AR命令的参数。默认值是rv。

    ●       ASFLAGS 汇编语言编译器参数(当明显地调用.s或.S文件时)。

    ●       CFLAGS C语言编译器参数。

    ●       CXXFLAGS C++语言编译器参数。

    ●       COFLAGS RCS命令参数。

    ●       CPPFLAGS C预处理器参数( C 和 Fortran 编译器也会用到)。

    ●       FFLAGS Fortran语言编译器参数。

    ●       GFLAGS SCCS get程序参数。

    ●       LDFLAGS 链接器参数(如ld)。

    ●       LFLAGS Lex文法分析器参数。

    ●       PFLAGS Pascal语言编译器参数。

    ●       RFLAGS Ratfor 程序的Fortran 编译器参数。

    ●       YFLAGS Yacc文法分析器参数。

    5.9.4 隐含规则链

    有些时候,一个目标可能被一系列的隐含规则所作用。例如,一个.o的文件生成,可能会是先被Yacc的.y文件先成.c,然后再被C的编译器生成。这一系列的隐含规则叫做“隐含规则链”。

    在上面的例子中,如果文件.c存在,就直接调用C的编译器的隐含规则;如果没有.c文件,但有一个.y文件,Yacc的隐含规则会被调用,生成.c文件,然后,再调用C编译的隐含规则,最终由.c生成.o文件,达到目标。

    这种.c的文件(或是目标)叫做中间目标。不管怎么样,make会努力自动推导生成目标的一切方法。不管中间目标有多少,其都会执着地把所有的隐含规则和书写的规则全部合起来分析,努力达到目标。所以,有些时候,可能会觉得奇怪,怎么目标会这样生成?怎么makefile文件发疯了?

    在默认情况下,中间目标和一般的目标有两个位置不同:第一个不同是除非中间的目标不存在,才会引发中间规则;第二个不同是,只要目标成功产生,产生最终目标的过程中,所产生的中间目标文件会被rm -f删除。

    通常,一个被makefile文件指定成目标或是依赖目标的文件不能当作中介。然而,可以显式地说明一个文件或是目标是中介目标,可以使用伪目标.INTERMEDIATE来强制声明(如.INTERMEDIATE:mid )。

    也可以阻止make自动删除中间目标。要做到这一点,可以使用伪目标.SECONDARY来强制声明(如.SECONDARY : sec)。还可以把目标以模式的方式来指定(如%.o)成伪目标.PRECIOUS的依赖目标,以保存被隐含规则所生成的中间文件。

    在隐含规则链中,禁止同一个目标出现两次或两次以上,这样一来,就可防止在make自动推导时出现无限递归的情况。

    Make会优化一些特殊的隐含规则,而不生成中间文件。如,从文件foo.c生成目标程序foo。按道理,make会编译生成中间文件foo.o,然后链接成foo,但在实际情况下,这一动作可以被一条cc命令完成(cc –o foo foo.c),于是优化过的规则就不会生成中间文件。 

    5.9.5 定义模式规则

    可以使用模式规则来定义一个隐含规则。一个模式规则跟一般的规则类似,只是在规则中,目标的定义需要有“%”字符。“%”的意思是表示一个或多个任意字符。在依赖目标中同样可以使用“%”,只是依赖目标中的“%”的取值取决于其目标。

    有一点需要注意的是,“%”的展开发生在变量和函数的展开之后,变量和函数的展开发生在make载入makefile文件时,而模式规则中的“%”则发生在运行时。

    1. 模式规则介绍

    模式规则中,至少在规则的目标定义中要包含“%”,否则,就是一般的规则。目标中的“%”定义表示对文件名的匹配,“%”表示长度任意的非空字符串。例如: %.c表示以.c结尾的文件名(文件名的长度至少为3),而s.%.c则表示以s.开头,.c结尾的文件名(文件名的长度至少为5)。

    如果“%”定义在目标中,目标中的“%”的值决定了依赖目标中的“%”的值,也就是说,目标中的模式的“%”决定了依赖目标中“%”的样子。例如有一个模式规则如下:

    %.o : %.c ; <command ... >

    其含义是,指出了从所有的.c文件生成相应的.o文件的规则。如果要生成的目标是a.o b.o,%c就是“a.c b.c”。

    一旦依赖目标中的“%”模式被确定,make会被要求去匹配当前目录下所有的文件名。在模式规则中,目标可能会是多个,如果有模式匹配出多个目标,make就会产生所有的模式目标,此时,make关心的是依赖的文件名和生成目标的命令这两件事。

    2. 模式规则示例

    下面这个例子表示了把所有的.c文件都编译成.o文件。

        %.o : %.c

                  $(CC) -c $(CFLAGS) $(CPPFLAGS) $< -o $@

    其中,“$@”表示所有的目标的逐个值,“$<”表示了所有依赖目标的逐个值。这些奇怪的变量叫“自动化变量”。

    下面的这个例子中有两个目标是模式的:

             %.tab.c %.tab.h: %.y

    bison -d $<

    这条规则告诉make把所有的.y文件都以bison -d <n>.y执行,然后生成<n>.tab.c和<n>.tab.h文件(其中,<n>表示一个任意字符串)。如果执行程序foo依赖于文件parse.tab.o和scan.o,并且文件scan.o依赖于文件parse.tab.h,如果parse.y文件被更新了,根据上述的规则,bison -d parse.y就会被执行一次,于是,parse.tab.o和scan.o的依赖文件就齐了 (假设parse.tab.o由parse.tab.c生成,scan.o由scan.c生成,而foo由parse.tab.o和scan.o”链接生成,而且foo和其.o文件的依赖关系已写好,所有的目标都会得到满足)。

    3. 自动化变量

    在上述的模式规则中,目标和依赖文件都是一系例的文件,如何书写一个命令来完成从不同的依赖文件生成相应的目标?因为在每一次的对模式规则的解析时,都会是不同的目标和依赖文件。

    自动化变量就是完成这个功能的。在前面,已经对自动化变量有所提及,相信看到这里已对它有一个感性认识了。所谓自动化变量,就是这种变量会把模式中所定义的一系列的文件自动地逐个取出,直至所有符合模式的文件都取完。这种自动化变量只应出现在规则的命令中。

    下面是所有的自动化变量及其说明:

    $@

    表示规则中的目标文件集。在模式规则中,如果有多个目标,“$@”就是匹配于目标中模式定义的集合。

    $%

    仅当目标是函数库文件时,表示规则中的目标成员名。例如,如果一个目标是foo.a(bar.o),“$%”就是bar.o,“$@”就是foo.a。如果目标不是函数库文件(如Unix下是.a,Windows下是.lib),其值为空。

    $<

    依赖目标中的第一个目标名字。如果依赖目标是以模式(即“%”)定义的,“$<”将是符合模式的一系列的文件集。注意,其是一个一个地取出来的。

    $?

    所有比目标新的依赖目标的集合,以空格分隔。

    $^

    所有的依赖目标的集合,以空格分隔。如果在依赖目标中有多个重复的,那么这个变量会去除重复的依赖目标,只保留一份。

    $+

    这个变量很像“$^”,也是所有依赖目标的集合。只是它不去除重复的依赖目标。

    $*

    这个变量表示目标模式中“%”及其之前的部分。如果目标是dir/a.foo.b,并且目标的模式是a.%.b,“$*”的值就是dir/a.foo。这个变量对于构造有关联的文件名比较有效。如果目标中没有模式的定义,“$*”也就不能被推导出,但是,如果目标文件的后缀是make所识别的,“$*”就是除了后缀的那一部分。例如:如果目标是foo.c,因为.c是make所能识别的后缀名,所以,“$*”的值就是foo。这个特性是GNU make的,很有可能不兼容于其他版本的make,所以,应该尽量避免使用“$*”,除非是在隐含规则或是静态模式中。如果目标中的后缀是make所不能识别的,“$*”就是空值。

    当希望只对更新过的依赖文件进行操作时,“$?”在显式规则中很有用。例如,假设有一个函数库文件叫lib,其由其他几个object文件更新,把object文件打包的比较有效率的makefile文件规则是:

    f lib : foo.o bar.o lose.o win.o

            ar r lib $?

    在上述所列出来的自动变量中,4个变量($@、$<、$%、$*)在扩展时只会有1个文件,而另3个的值是一个文件列表。这7个自动化变量还可以取得文件的目录名或是在当前目录下的符合模式的文件名,只需要搭配上“D”或“F”字样。这是GNU make中老版本的特性,在新版本中,使用函数dir或notdir就可以做到了。D的含义是Directory,就是目录;F的含义是File,就是文件。

    下面是对上面的7个变量分别加上“D”或是“F”的含义:

    $(@D)

    表示“$@”的目录部分(不以斜杠作为结尾),如果“$@”值是dir/foo.o,“$(@D)”就是dir,而如果“$@”中没有包含斜杠,其值就是“.”(当前目录)。

    $(@F)

    表示“$@”的文件部分,如果“$@”值是dir/foo.o,“$(@F)”就是foo.o,“$(@F)”相当于函数$(notdir $@)。

    $(*D)

    $(*F)

    和上面所述的同理,也是取文件的目录部分和文件部分。对于上面的那个例子,“$(*D)”返回dir,而“$(*F)”返回foo。

    $(%D)

    $(%F)

    分别表示了函数包文件成员的目录部分和文件部分。这对于形同archive(member)形式的目标中的member中包含了不同的目录很有用。

    $(<D)

    $(<F)

    分别表示依赖文件的目录部分和文件部分。

    $(^D)

    $(^F)

    分别表示所有依赖文件的目录部分和文件部分(无相同的)。

    $(+D)

    $(+F)

    分别表示所有依赖文件的目录部分和文件部分(可以有相同的)

    $(?D)

    $(?F)

    分别表示被更新的依赖文件的目录部分和文件部分。

    最后提醒一下的是,对于“$<”,为了避免产生不必要的麻烦,最好给“$”后面的那个特定字符都加上圆括号,比如,“$(<)”就要比“$<”好一些。

    还要注意的是,这些变量只使用在规则的命令中,而且一般都是“显式规则”和“静态模式规则”,其在隐含规则中并没有意义。

    4. 模式的匹配

    一般来说,一个目标的模式有一个带有前缀或是后缀的“%”,或是没有前后缀,直接就是一个“%”。因为“%”代表一个或多个字符,所以在定义好了的模式中,把“%”所匹配的内容叫做“茎”,例如“%.c”所匹配的文件test.c中test就是“茎”。因为在目标和依赖目标中同时有“%”时,依赖目标的“茎”会传给目标,当做目标中的“茎”。

    当一个模式匹配包含有斜杠(实际也不经常包含)的文件时,在进行模式匹配时,目录部分会首先被移开,然后进行匹配,成功后,再把目录加回去。在进行“茎”的传递时,需要知道这个步骤。例如有一个模式e%t,文件src/eat匹配于该模式,于是src/a就是其“茎”。如果这个模式定义在依赖目标中,而依赖于这个模式的目标中又有个模式c%r,目标就是src/car (“茎”被传递)。

    5. 重载内建隐含规则

    可以重载内建的隐含规则(或是定义一个全新的),例如可以重新构造和内建隐含规则不同的命令,如:

    %.o : %.c

    $(gcc) -c $(CPPFLAGS) $(CFLAGS) -D$(date)

    可以取消内建的隐含规则,只要不在后面写命令就行。如:

             %.o : %.s

    同样,也可以重新定义一个全新的隐含规则,其在隐含规则中的位置取决于在哪里写下这个规则。朝前的位置就靠前。

    5.9.6 隐含规则搜索算法

    比如有一个目标叫T,下面是搜索目标T的规则的算法。请注意,在下面没有提到后缀规则,原因是所有的后缀规则在makefile文件被载入内存时,会转换成模式规则。如果目标是archive(member)的函数库文件模式,这个算法会运行两次,第一次是找目标T,如果没有找到,进入第二次,第二次会把member当作T来搜索。

    (1) 把T的目录部分分离出来,叫D,而剩余部分叫N(例如,如果T是src/foo.o,D就是src/,N就是foo.o)。

    (2) 创建所有匹配于T或是N的模式规则列表。

    (3) 如果在模式规则列表中有匹配所有文件的模式,如“%”,从列表中移除其他的模式。

    (4) 移除列表中没有命令的规则。

    (5) 对于第一个在列表中的模式规则:

    ●       推导其“茎”S,S应该是T或是N匹配于模式中“%”非空的部分。

    ●       计算依赖文件。把依赖文件中的“%”都替换成“茎”S。如果目标模式中没有包含斜框字符,就把D加在第一个依赖文件的开头。

    ●       测试是否所有的依赖文件都存在或是理当存在(如果有一个文件被定义成另外一个规则的目标文件,或者是一个显式规则的依赖文件,这个文件就叫“理当存在”)。

    ●       如果所有的依赖文件存在或是理当存在,或是就没有依赖文件,这条规则将被采用,退出该算法。

    (6) 如果经过第5步,没有找到模式规则,就作更进一步的搜索。对于存在于列表中的第一个模式规则:

    ●       如果规则是终止规则,那就忽略它,继续下一条模式规则。

    ●       计算依赖文件(同第5步)。

    ●       测试所有的依赖文件是否存在或是理当存在。

    ●       对于不存在的依赖文件,递归调用这个算法,查找它是否可以被隐含规则找到。

    ●       如果所有的依赖文件存在或是理当存在,或是就根本没有依赖文件。这条规则被采用,退出该算法。

    (7) 如果没有隐含规则可以使用,查看.DEFAULT规则,如果有,就采用,把.DEFAULT的命令给T使用。

    一旦规则被找到,就会执行其相当的命令,而此时,自动化变量的值才会生成。

    5.10 使用make更新函数库文件

    函数库文件也就是对Object文件(程序编译的中间文件)的打包文件。在Unix下,一般是由命令ar来完成打包工作。

    5.10.1 函数库文件的成员

    一个函数库文件由多个文件组成。可以以如下格式指定函数库文件及其组成:

    archive(member)

    这不是一个命令,而是一个目标和依赖的定义。一般来说,这种用法基本上就是为了ar命令来服务的。如:

    foolib(hack.o) : hack.o

            ar cr foolib hack.o

    如果要指定多个member,那就以空格分开,如:

    foolib(hack.o kludge.o)

    其等价于:

    foolib(hack.o) foolib(kludge.o)

    还可以使用Shell的文件通配符来定义,如:

    foolib(*.o)

    5.10.2 函数库成员的隐含规则

    当make搜索一个目标的隐含规则时,一个特性是,如果这个目标是“a(m)”形式的,其会把目标变成“(m)”。于是,如果成员是“%.o”的模式定义,并且如果使用make foo.a(bar.o)的形式调用makefile文件,隐含规则会去找bar.o的规则;如果没有定义bar.o的规则,内建隐含规则生效,make会去找bar.c文件来生成bar.o。如果找得到,make执行的命令大致如下:

    gcc -c bar.c -o bar.o

        ar r foo.a bar.o

        rm -f bar.o

    还有一个变量要注意的是“$%”,这是专属函数库文件的自动化变量。

    5.10.3 函数库文件的后缀规则

    可以使用后缀规则和隐含规则来生成函数库打包文件,如:   

    c.a:

         $(gcc) $(CFLAGS) $(CPPFLAGS) -c $< -o $*.o

         $(AR) r $@ $*.o

         $(RM) $*.o

    其等效于:

    (%.o) : %.c

          $(CC) $(CFLAGS) $(CPPFLAGS) -c $< -o $*.o

          $(AR) r $@ $*.o

          $(RM) $*.o

    5.10.4 注意事项

    在生成函数库打包文件时,请小心使用make的并行机制(-j参数)。如果多个ar命令在同一时间运行在同一个函数库打包文件上,就很有可能损坏这个函数库文件。所以,在make未来的版本中,应该提供一种机制来避免并行操作发生在函数打包文件上。但就目前而言,还是尽量不要使用-j参数。

    以上基本上就是GNU make的makefile文件的所有细节了。无论什么样的make,都是以文件的依赖性为基础的,其基本都是遵循一个标准的。对于前述所有的make的细节,不但可以利用make这个工具来编译程序,还可以利用make来完成其他的工作。因为规则中的命令可以是任何Shell之下的命令,所以,在Linux下,不一定只使用程序语言的编译器,还可以在makefile文件中书写其他的命令,如tar、awk、mail、sed、cvs、compress、ls、rm、yacc、rpm、ftp等,来完成诸如程序打包、程序备份、制作程序安装包、提交代码、使用程序模板、合并文件等诸多功能,如文件操作、文件管理、编程开发设计,或是其他一些异想天开的东西

    展开全文
  • Linux下C语言编程资料

    2014-04-07 20:48:59
    1(Linux程序设计入门——基础知识Linux下C语言编程基础知识前言:这篇文章介绍在LINUX下进行C语言编程所需要的基础知识。在这篇文章当中,我们将会学到以下内容:源程序编译Makefile的编写程序库的链接程序的调试...
    1(Linux程序设计入门——基础知识Linux下C语言编程基础知识前言:这篇文章介绍在LINUX下进行C语言编程所需要的基础知识。在这篇文章当中,我们将会学到以下内容:源程序编译Makefile的编写程序库的链接程序的调试头文件和系统求助
    

        1.源程序的编译在Linux下面,如果要编译一个C语言源程序,我们要使用GNU的gcc编译器。 下面我们以一个实例来说明如何使用gcc编译器。

        假设我们有下面一个非常简单的源程序(hello.c):int main(int argc,char **argv)

        { printf("Hello Linux/n");}要编译这个程序,我们只要在命令行下执行:gcc -o hello hello.c gcc 编译器就会为我们生成一个hello的可执行文件。执行。/hello就可以看到程序的输出结果了。命令行中 gcc表示我们是用gcc来编译我们的源程序,-o 选项表示我们要求编译器给我们输出的可执行文件名为hello 而hello.c是我们的源程序文件。

        gcc编译器有许多选项,一般来说我们只要知道其中的几个就够了。 -o选项我们已经知道了,表示我们要求输出的可执行文件名。 -c选项表示我们只要求编译器输出目标代码,而不必要输出可执行文件。 -g选项表示我们要求编译器在编译的时候提供我们以后对程序进行调试的信息。

        知道了这三个选项,我们就可以编译我们自己所写的简单的源程序了,如果你想要知道更多的选项,可以查看gcc的帮助文档,那里有着许多对其它选项的详细说明。

        2.Makefile的编写假设我们有下面这样的一个程序,源代码如下:/* main.c */ #include "mytool1.h" #include "mytool2.h" int main(int argc,char **argv)

        { mytool1_print("hello");mytool2_print("hello");} /* mytool1.h */ #ifndef _MYTOOL_1_H #define _MYTOOL_1_H void mytool1_print(char *print_str);#endif /* mytool1.c */ #include "mytool1.h" void mytool1_print(char *print_str)

        { printf("This is mytool1 print %s/n",print_str);} /* mytool2.h */ #ifndef _MYTOOL_2_H #define _MYTOOL_2_H void mytool2_print(char *print_str);#endif /* mytool2.c */ #include "mytool2.h" void mytool2_print(char *print_str)

        { printf("This is mytool2 print %s/n",print_str);}当然由于这个程序是很短的我们可以这样来编译gcc -c main.c gcc -c mytool1.c gcc -c mytool2.c gcc -o main main.o mytool1.o mytool2.o这样的话我们也可以产生main程序,而且也不时很麻烦。但是如果我们考虑一下如果有一天我们修改了其中的一个文件(比如说mytool1.c)那么我们难道还要重新输入上面的命令?也许你会说,这个很容易解决啊,我写一个SHELL脚本,让她帮我去完成不就可以了。是的对于这个程序来说,是可以起到作用的。但是当我们把事情想的更复杂一点,如果我们的程序有几百个源程序的时候,难道也要编译器重新一个一个的去编译?为此,聪明的程序员们想出了一个很好的工具来做这件事情,这就是make.我们只要执行以下make,就可以把上面的问题解决掉。在我们执行make之前,我们要先编写一个非常重要的文件。——Makefile.对于上面的那个程序来说,可能的一个Makefile的文件是:# 这是上面那个程序的Makefile文件main:main.o mytool1.o mytool2.o gcc -o main main.o mytool1.o mytool2.o main.o:main.c mytool1.h mytool2.h gcc -c main.c mytool1.o:mytool1.c mytool1.h gcc -c mytool1.c mytool2.o:mytool2.c mytool2.h gcc -c mytool2.c有了这个Makefile文件,不过我们什么时候修改了源程序当中的什么文件,我们只要执行make命令,我们的编译器都只会去编译和我们修改的文件有关的文件,其它的文件她连理都不想去理的。下面我们学习Makefile是如何编写的。

        在Makefile中也#开始的行都是注释行。Makefile中最重要的是描述文件的依赖关系的说明。一般的格式是:target: components TAB rule第一行表示的是依赖关系。第二行是规则。

        比如说我们上面的那个Makefile文件的第二行main:main.o mytool1.o mytool2.o表示我们的目标(target)main的依赖对象(components)是main.o mytool1.o mytool2.o当倚赖的对象在目标修改后修改的话,就要去执行规则一行所指定的命令。就象我们的上面那个Makefile第三行所说的一样要执行 gcc -o main main.o mytool1.o mytool2.o注意规则一行中的TAB表示那里是一个TAB键Makefile有三个非常有用的变量。分别是$@,$^,$<代表的意义分别是:$@——目标文件,$^——所有的依赖文件,$<——第一个依赖文件。

        如果我们使用上面三个变量,那么我们可以简化我们的Makefile文件为:# 这是简化后的Makefile main:main.o mytool1.o mytool2.o gcc -o $@ $^ main.o:main.c mytool1.h mytool2.h gcc -c $< mytool1.o:mytool1.c mytool1.h gcc -c $< mytool2.o:mytool2.c mytool2.h gcc -c $<经过简化后我们的Makefile是简单了一点,不过人们有时候还想简单一点。这里我们学习一个Makefile的缺省规则……c.o:gcc -c $<这个规则表示所有的 .o文件都是依赖与相应的。c文件的。例如mytool.o依赖于mytool.c这样Makefile还可以变为:# 这是再一次简化后的Makefile main:main.o mytool1.o mytool2.o gcc -o $@ $^……c.o:gcc -c $<好了,我们的Makefile 也差不多了,如果想知道更多的关于Makefile规则可以查看相应的文档。

        3.程序库的链接试着编译下面这个程序/* temp.c */ #include <math.h> int main(int argc,char **argv)

        { double value;printf("Value:%f/n",value);}这个程序相当简单,但是当我们用 gcc -o temp temp.c 编译时会出现下面所示的错误。

        /tmp/cc33Kydu.o: In function `main':/tmp/cc33Kydu.o(。text+0xe): undefined reference to `log' collect2: ld returned 1 exit status出现这个错误是因为编译器找不到log的具体实现。虽然我们包括了正确的头文件,但是我们在编译的时候还是要连接确定的库。在Linux下,为了使用数学函数,我们必须和数学库连接,为此我们要加入 -lm 选项。 gcc -o temp temp.c -lm这样才能够正确的编译。也许有人要问,前面我们用printf函数的时候怎么没有连接库呢?是这样的,对于一些常用的函数的实现,gcc编译器会自动去连接一些常用库,这样我们就没有必要自己去指定了。 有时候我们在编译程序的时候还要指定库的路径,这个时候我们要用到编译器的 -L选项指定路径。比如说我们有一个库在 /home/hoyt/mylib下,这样我们编译的时候还要加上 -L/h ome/hoyt/mylib.对于一些标准库来说,我们没有必要指出路径。只要它们在起缺省库的路径下就可以了。系统的缺省库的路径/lib /usr/lib /usr/local/lib 在这三个路径下面的库,我们可以不指定路径。

        还有一个问题,有时候我们使用了某个函数,但是我们不知道库的名字,这个时候怎么办呢?很抱歉,对于这个问题我也不知道答案,我只有一个傻办法。首先,我到标准库路径下面去找看看有没有和我用的函数相关的库,我就这样找到了线程(thread)函数的库文件(libp thread.a)。 当然,如果找不到,只有一个笨方法。比如我要找sin这个函数所在的库。 就只好用 nm -o /lib/*.so|grep sin>~/sin 命令,然后看~/sin文件,到那里面去找了。 在s in文件当中,我会找到这样的一行libm-2.1.2.so:00009fa0 W sin 这样我就知道了sin在libm-2.1.2.so库里面,我用 -lm选项就可以了(去掉前面的lib和后面的版本标志,就剩下m了所以是 -lm)。 如果你知道怎么找,请赶快告诉我,我回非常感激的。谢谢!

        4.程序的调试我们编写的程序不太可能一次性就会成功的,在我们的程序当中,会出现许许多多我们想不到的错误,这个时候我们就要对我们的程序进行调试了。

        最常用的调试软件是gdb.如果你想在图形界面下调试程序,那么你现在可以选择xxgdb.记得要在编译的时候加入 -g选项。关于gdb的使用可以看gdb的帮助文件。由于我没有用过这个软件,所以我也不能够说出如何使用。 不过我不喜欢用gdb.跟踪一个程序是很烦的事情,我一般用在程序当中输出中间变量的值来调试程序的。当然你可以选择自己的办法,没有必要去学别人的。现在有了许多IDE环境,里面已经自己带了调试器了。你可以选择几个试一试找出自己喜欢的一个用。

        5.头文件和系统求助有时候我们只知道一个函数的大概形式,不记得确切的表达式,或者是不记得着函数在那个头文件进行了说明。这个时候我们可以求助系统。

        比如说我们想知道fread这个函数的确切形式,我们只要执行 man fread 系统就会输出着函数的详细解释的。和这个函数所在的头文件<stdio.h>说明了。 如果我们要write这个函数的说明,当我们执行man write时,输出的结果却不是我们所需要的。 因为我们要的是w rite这个函数的说明,可是出来的却是write这个命令的说明。为了得到write的函数说明我们要用 man 2 write. 2表示我们用的write这个函数是系统调用函数,还有一个我们常用的是3表示函数是C的库函数。

        记住不管什么时候,man都是我们的最好助手。

        好了,这一章就讲这么多了,有了这些知识我们就可以进入激动人心的Linux下的C程序探险活动。

        2(Linux程序设计入门——进程介绍Linux下进程的创建前言:这篇文章是用来介绍在Linux下和进程相关的各个概念。我们将会学到:进程的概念进程的身份进程的创建守护进程的创建


        1.进程的概念Linux操作系统是面向多用户的。在同一时间可以有许多用户向操作系统发出各种命令。那么操作系统是怎么实现多用户的环境呢? 在现代的操作系统里面,都有程序和进程的概念。那么什么是程序,什么是进程呢? 通俗的讲程序是一个包含可以执行代码的文件,是一个静态的文件。而进程是一个开始执行但是还没有结束的程序的实例。就是可执行文件的具体实现。 一个程序可能有许多进程,而每一个进程又可以有许多子进程。依次循环下去,而产生子孙进程。 当程序被系统调用到内存以后,系统会给程序分配一定的资源(内存,设备等等)然后进行一系列的复杂操作,使程序变成进程以供系统调用。在系统里面只有进程没有程序,为了区分各个不同的进程,系统给每一个进程分配了一个ID(就象我们的身份证)以便识别。 为了充分的利用资源,系统还对进程区分了不同的状态。将进程分为新建,运行,阻塞,就绪和完成五个状态。 新建表示进程正在被创建,运行是进程正在运行,阻塞是进程正在等待某一个事件发生,就绪是表示系统正在等待CPU来执行命令,而完成表示进程已经结束了系统正在回收资源。 关于进程五个状态的详细解说我们可以看《操作系统》上面有详细的解说。

        2.进程的标志上面我们知道了进程都有一个ID,那么我们怎么得到进程的ID呢?系统调用getpid可以得到进程的ID,而getppid可以得到父进程(创建调用该函数进程的进程)的ID. #include <unistd> pid_t getpid(void);pid_t getppid(void);进程是为程序服务的,而程序是为了用户服务的。系统为了找到进程的用户名,还为进程和用户建立联系。这个用户称为进程的所有者。相应的每一个用户也有一个用户ID.通过系统调用getuid可以得到进程的所有者的ID.由于进程要用到一些资源,而Linux对系统资源是进行保护的,为了获取一定资源进程还有一个有效用户ID.这个ID和系统的资源使用有关,涉及到进程的权限。 通过系统调用geteuid我们可以得到进程的有效用户ID. 和用户ID相对应进程还有一个组ID和有效组ID系统调用getgid和getegid可以分别得到组ID和有效组ID #include <unistd> #include <sys/types.h>

        uid_t getuid(void);uid_t geteuid(void);gid_t getgid(void);git_t getegid(void);有时候我们还会对用户的其他信息感兴趣(登录名等等),这个时候我们可以调用getpwui d来得到。

        struct passwd { char *pw_name; /* 登录名称 */ char *pw_passwd; /* 登录口令 */ uid_t pw_uid; /* 用户ID */ gid_t pw_gid; /* 用户组ID */ char *pw_gecos; /* 用户的真名 */ char *pw_dir; /* 用户的目录 */ char *pw_shell; /* 用户的SHELL */ };#include <pwd.h> #include <sys/types.h>

        struct passwd *getpwuid(uid_t uid);下面我们学习一个实例来实践一下上面我们所学习的几个函数:#include <unistd.h> #include <pwd.h> #include <sys/types.h> #include <stdio.h> int main(int argc,char **argv)

        { pid_t my_pid,parent_pid;uid_t my_uid,my_euid;gid_t my_gid,my_egid;struct passwd *my_info;my_pid=getpid();parent_pid=getppid();my_uid=getuid();my_euid=geteuid();my_gid=getgid();my_egid=getegid();my_info=getpwuid(my_uid);printf("Process ID:%ld/n",my_pid);printf("Parent ID:%ld/n",parent_pid);printf("User ID:%ld/n",my_uid);printf("Effective User ID:%ld/n",my_euid);printf("Group ID:%ld/n",my_gid);printf("Effective Group ID:%ld/n",my_egid):if(my_info)

        { printf("My Login Name:%s/n" ,my_info->pw_name);printf("My Password :%s/n" ,my_info->pw_passwd);printf("My User ID :%ld/n",my_info->pw_uid);printf("My Group ID :%ld/n",my_info->pw_gid);printf("My Real Name:%s/n" ,my_info->pw_gecos);printf("My Home Dir :%s/n", my_info->pw_dir);printf("My Work Shell:%s/n", my_info->pw_shell);} 3.进程的创建创建一个进程的系统调用很简单。我们只要调用fork函数就可以了。

        #include <unistd.h>

        pid_t fork();当一个进程调用了fork以后,系统会创建一个子进程。这个子进程和父进程不同的地方只有他的进程ID和父进程ID,其他的都是一样。就象符进程克隆(clone)自己一样。当然创建两个一模一样的进程是没有意义的。为了区分父进程和子进程,我们必须跟踪fork的返回值。 当fork掉用失败的时候(内存不足或者是用户的最大进程数已到)fork返回-1,否则f ork的返回值有重要的作用。对于父进程fork返回子进程的ID,而对于fork子进程返回0.我们就是根据这个返回值来区分父子进程的。 父进程为什么要创建子进程呢?前面我们已经说过了Linux是一个多用户操作系统,在同一时间会有许多的用户在争夺系统的资源。有时进程为了早一点完成任务就创建子进程来争夺资源。 一旦子进程被创建,父子进程一起从fork处继续执行,相互竞争系统的资源。有时候我们希望子进程继续执行,而父进程阻塞直到子进程完成任务。这个时候我们可以调用wait或者waitpid系统调用。

        #include <sys/types.h> #include <sys/wait.h>

        pid_t wait(int *stat_loc);pid_t waitpid(pid_t pid,int *stat_loc,int options);wait系统调用会使父进程阻塞直到一个子进程结束或者是父进程接受到了一个信号。如果没有父进程没有子进程或者他的子进程已经结束了wait回立即返回。成功时(因一个子进程结束)wait将返回子进程的ID,否则返回-1,并设置全局变量errno.stat_loc是子进程的退出状态。子进程调用exit,_exit 或者是return来设置这个值。 为了得到这个值Linux定义了几个宏来测试这个返回值。

        WIFEXITED:判断子进程退出值是非0 WEXITSTATUS:判断子进程的退出值(当子进程退出时非0)。

        WIFSIGNALED:子进程由于有没有获得的信号而退出。

        WTERMSIG:子进程没有获得的信号号(在WIFSIGNALED为真时才有意义)。

        waitpid等待指定的子进程直到子进程返回。如果pid为正值则等待指定的进程(pid)。如果为0则等待任何一个组ID和调用者的组ID相同的进程。为-1时等同于wait调用。小于-1时等待任何一个组ID等于pid绝对值的进程。 stat_loc和wait的意义一样。 options可以决定父进程的状态。可以取两个值 WNOHANG:父进程立即返回当没有子进程存在时。 WUNTACHE D:当子进程结束时waitpid返回,但是子进程的退出状态不可得到。

        父进程创建子进程后,子进程一般要执行不同的程序。为了调用系统程序,我们可以使用系统调用exec族调用。exec族调用有着5个函数。

        #include <unistd.h> int execl(const char *path,const char *arg,……);int execlp(const char *file,const char *arg,……);int execle(const char *path,const char *arg,……);int execv(const char *path,char *const argv[]);int execvp(const char *file,char *const argv[]):exec族调用可以执行给定程序。关于exec族调用的详细解说可以参考系统手册(man exec l)。 下面我们来学习一个实例。注意编译的时候要加 -lm以便连接数学函数库。

        #include <unistd.h> #include <sys/types.h> #include <sys/wait.h> #include <stdio.h> #include <errno.h> #include <math.h> void main(void)

        { pid_t child;int status;printf("This will demostrate how to get child status/n");if()child=fork()(==-1)

        { printf("Fork Error :%s/n",strerror)errno();exit(1);} else if(child==0)

        { int i;printf("I am the child:%ld/n",getpid)();for(i=0;i<1000000;i++) sin(i);i=5;printf("I exit with %d/n",i);exit(i);} while()(child=wait)&status()==-1(&)errno==EINTR();if(child==-1)

        printf("Wait Error:%s/n",strerror)errno();else if(!status)

        printf("Child %ld terminated normally return status is zero/n",child);else if(WIFEXITED)status()

        printf("Child %ld terminated normally return status is %d/n",child,WEXITSTATUS)status();else if(WIFSIGNALED)status()

        printf("Child %ld terminated due to signal %d znot caught/n",child,WTERMSIG)status();{ strerror函数会返回一个指定的错误号的错误信息的字符串。

        4.守护进程的创建如果你在DOS时代编写过程序,那么你也许知道在DOS下为了编写一个常驻内存的程序我们要编写多少代码了。相反如果在Linux下编写一个"常驻内存"的程序却是很容易的。我们只要几行代码就可以做到。 实际上由于Linux是多任务操作系统,我们就是不编写代码也可以把一个程序放到后台去执行的。我们只要在命令后面加上&符号SHELL就会把我们的程序放到后台去运行的。 这里我们"开发"一个后台检查邮件的程序。这个程序每个一个指定的时间回去检查我们的邮箱,如果发现我们有邮件了,会不断的报警(通过机箱上的小喇叭来发出声音)。 后面有这个函数的加强版本加强版本后台进程的创建思想: 首先父进程创建一个子进程。然后子进程杀死父进程(是不是很无情?)。 信号处理所有的工作由子进程来处理。

        #include <unistd.h> #include <sys/types.h> #include <sys/stat.h> #include <stdio.h> #include <errno.h> #include <fcntl.h> #include <signal.h> /* Linux 的默任个人的邮箱地址是 /var/spool/mail/用户的登录名 */ #define MAIL "/var/spool/mail/hoyt" /* 睡眠10秒钟 */

        #define SLEEP_TIME 10 main(void)

        { pid_t child;if()child=fork()(==-1)

        { printf("Fork Error:%s/n",strerror)errno();exit(1);} else if(child>0)

        while(1);if(kill)getppid(),SIGTERM(==-1)

        { printf("Kill Parent Error:%s/n",strerror)errno();exit(1);} { int mailfd;while(1)

        { if()mailfd=open(MAIL,O_RDONLY)(!=-1)

        { fprintf(stderr,"%s","7");close(mailfd);} sleep(SLEEP_TIME);{你可以在默认的路径下创建你的邮箱文件,然后测试一下这个程序。当然这个程序还有很多地方要改善的。我们后面会对这个小程序改善的,再看我的改善之前你可以尝试自己改善一下。比如让用户指定邮相的路径和睡眠时间等等。相信自己可以做到的。动手吧,勇敢的探险者。

        好了进程一节的内容我们就先学到这里了。进程是一个非常重要的概念,许多的程序都会用子进程。创建一个子进程是每一个程序员的基本要求!

        3(Linux程序设计入门——文件操作Linux下文件的操作前言:我们在这一节将要讨论linux下文件操作的各个函数。

        文件的创建和读写文件的各个属性目录文件的操作管道文件

    ----------------------------------------------------------------------------
    ----

        1.文件的创建和读写我假设你已经知道了标准级的文件操作的各个函数(fopen,fread,fwrite等等)。当然如果你不清楚的话也不要着急。我们讨论的系统级的文件操作实际上是为标准级文件操作服务的。

        当我们需要打开一个文件进行读写操作的时候,我们可以使用系统调用函数open.使用完成以后我们调用另外一个close函数进行关闭操作。

        #include <fcntl.h> #include <unistd.h> #include <sys/types.h> #include <sys/stat.h>

        int open(const char *pathname,int flags);int open(const char *pathname,int flags,mode_t mode);int close(int fd);open函数有两个形式。其中pathname是我们要打开的文件名(包含路径名称,缺省是认为在当前路径下面)。flags可以去下面的一个值或者是几个值的组合。

        O_RDONLY:以只读的方式打开文件。

        O_WRONLY:以只写的方式打开文件。

        O_RDWR:以读写的方式打开文件。

        O_APPEND:以追加的方式打开文件。

        O_CREAT:创建一个文件。

        O_EXEC:如果使用了O_CREAT而且文件已经存在,就会发生一个错误。

        O_NOBLOCK:以非阻塞的方式打开一个文件。

        O_TRUNC:如果文件已经存在,则删除文件的内容。

        前面三个标志只能使用任意的一个。如果使用了O_CREATE标志,那么我们要使用open的第二种形式。还要指定mode标志,用来表示文件的访问权限。mode可以是以下情况的组合。

    -----------------------------------------------------------------

        S_IRUSR 用户可以读 S_IWUSR 用户可以写S_IXUSR 用户可以执行 S_IRWXU 用户可以读写执行

    -----------------------------------------------------------------

        S_IRGRP 组可以读 S_IWGRP 组可以写S_IXGRP 组可以执行 S_IRWXG 组可以读写执行

    -----------------------------------------------------------------

        S_IROTH 其他人可以读 S_IWOTH 其他人可以写S_IXOTH 其他人可以执行 S_IRWXO 其他人可以读写执行

    -----------------------------------------------------------------

        S_ISUID 设置用户执行ID S_ISGID 设置组的执行ID

    -----------------------------------------------------------------

        我们也可以用数字来代表各个位的标志。Linux总共用5个数字来表示文件的各种权限。

        00000.第一位表示设置用户ID.第二位表示设置组ID,第三位表示用户自己的权限位,第四位表示组的权限,最后一位表示其他人的权限。

        每个数字可以取1(执行权限),2(写权限),4(读权限),0(什么也没有)或者是这几个值的和……

        比如我们要创建一个用户读写执行,组没有权限,其他人读执行的文件。设置用户ID位那么我们可以使用的模式是——1(设置用户ID)0(组没有设置)7(1+2+4)0(没有权限,使用缺省)

        5(1+4)即10705:open("temp",O_CREAT,10705);如果我们打开文件成功,open会返回一个文件描述符。我们以后对文件的所有操作就可以对这个文件描述符进行操作了。

        当我们操作完成以后,我们要关闭文件了,只要调用close就可以了,其中fd是我们要关闭的文件描述符。

        文件打开了以后,我们就要对文件进行读写了。我们可以调用函数read和write进行文件的读写。

        #include <unistd.h> ssize_t read(int fd, void *buffer,size_t count);ssize_t write(int fd, const void *buffer,size_t count);fd是我们要进行读写操作的文件描述符,buffer是我们要写入文件内容或读出文件内容的内存地址。count是我们要读写的字节数。

        对于普通的文件read从指定的文件(fd)中读取count字节到buffer缓冲区中(记住我们必须提供一个足够大的缓冲区),同时返回count.如果read读到了文件的结尾或者被一个信号所中断,返回值会小于count.如果是由信号中断引起返回,而且没有返回数据,read会返回-1,且设置errno为EINTR.当程序读到了文件结尾的时候,read会返回0. write从buffer中写count字节到文件fd中,成功时返回实际所写的字节数。

        下面我们学习一个实例,这个实例用来拷贝文件。

        #include <unistd.h> #include <fcntl.h> #include <stdio.h> #include <sys/types.h> #include <sys/stat.h> #include <errno.h> #include <string.h> #define BUFFER_SIZE 1024 int main(int argc,char **argv)

        { int from_fd,to_fd;int bytes_read,bytes_write;char buffer[BUFFER_SIZE];char *ptr;if(argc!=3)

        { fprintf(stderr,"Usage:%s fromfile tofile/n/a",argv[0]);exit(1);} /* 打开源文件 */ if()from_fd=open(argv[1],O_RDONLY)(==-1)

        { fprintf(stderr,"Open %s Error:%s/n",argv[1],strerror)errno();exit(1);} /* 创建目的文件 */ if()to_fd=open(argv[2],O_WRONLY|O_CREAT,S_IRUSR|S_IWUSR)(==-1)

        { fprintf(stderr,"Open %s Error:%s/n",argv[2],strerror)errno();exit(1);} /* 以下代码是一个经典的拷贝文件的代码 */ while(bytes_read=read)from_fd,buffer,BUFFER_SIZE()

        { /* 一个致命的错误发生了 */ if()bytes_read==-1(&&)errno!=EINTR() break;else if(bytes_read>0)

        { ptr=buffer;while(bytes_write=write)to_fd,ptr,bytes_read()

        { /* 一个致命错误发生了 */ if()bytes_write==-1(&&)errno!=EINTR()break;/* 写完了所有读的字节 */ else if(bytes_write==bytes_read) break;/* 只写了一部分,继续写 */ else if(bytes_write>0)

        { ptr+=bytes_write;bytes_read-=bytes_write;} /* 写的时候发生的致命错误 */ if(bytes_write==-1)break;{ close(from_fd);close(to_fd);exit(0);} 2.文件的各个属性文件具有各种各样的属性,除了我们上面所知道的文件权限以外,文件还有创建时间,大小等等属性。

        有时侯我们要判断文件是否可以进行某种操作(读,写等等)。这个时候我们可以使用acce ss函数。

        #include <unistd.h>

        int access(const char *pathname,int mode);pathname:是文件名称,mode是我们要判断的属性。可以取以下值或者是他们的组合。

        R_OK文件可以读,W_OK文件可以写,X_OK文件可以执行,F_OK文件存在。当我们测试成功时,函数返回0,否则如果有一个条件不符时,返回-1.如果我们要获得文件的其他属性,我们可以使用函数stat或者fstat. #include <sys/stat.h> #include <unistd.h> int stat(const char *file_name,struct stat *buf);int fstat(int filedes,struct stat *buf);struct stat { dev_t st_dev; /* 设备 */ ino_t st_ino; /* 节点 */ mode_t st_mode; /* 模式 */ nlink_t st_nlink; /* 硬连接 */ uid_t st_uid; /* 用户ID */ gid_t st_gid; /* 组ID */ dev_t st_rdev; /* 设备类型 */ off_t st_off; /* 文件字节数 */ unsigned long st_blksize; /* 块大小 */ unsigned long st_blocks; /* 块数 */ time_t st_atime; /* 最后一次访问时间 */ time_t st_mtime; /* 最后一次修改时间 */ time_t st_ctime; /* 最后一次改变时间(指属性) */ };stat用来判断没有打开的文件,而fstat用来判断打开的文件。我们使用最多的属性是st_ mode.通过着属性我们可以判断给定的文件是一个普通文件还是一个目录,连接等等。可以使用下面几个宏来判断。

        S_ISLNK(st_mode):是否是一个连接。S_ISREG是否是一个常规文件。S_ISDIR是否是一个目录S_ISCHR是否是一个字符设备。S_ISBLK是否是一个块设备S_ISFIFO是否 是一个FIFO文件。S_ISSOCK是否是一个SOCKET文件。 我们会在下面说明如何使用这几个宏的。

        3.目录文件的操作在我们编写程序的时候,有时候会要得到我们当前的工作路径。C库函数提供了get cwd来解决这个问题。

        #include <unistd.h>

        char *getcwd(char *buffer,size_t size);我们提供一个size大小的buffer,getcwd会把我们当前的路径考到buffer中。如果buffer太小,函数会返回-1和一个错误号。

        Linux提供了大量的目录操作函数,我们学习几个比较简单和常用的函数。

        #include <dirent.h> #include <unistd.h> #include <fcntl.h> #include <sys/types.h> #include <sys/stat.h> int mkdir(const char *path,mode_t mode);DIR *opendir(const char *path);struct dirent *readdir(DIR *dir);void rewinddir(DIR *dir);off_t telldir(DIR *dir);void seekdir(DIR *dir,off_t off);int closedir(DIR *dir);struct dirent { long d_ino;off_t d_off;unsigned short d_reclen;char d_name[NAME_MAX+1]; /* 文件名称 */ mkdir很容易就是我们创建一个目录,opendir打开一个目录为以后读做准备。readdir读一个打开的目录。rewinddir是用来重读目录的和我们学的rewind函数一样。closedir是关闭一个目录。telldir和seekdir类似与ftee和fseek函数。

        下面我们开发一个小程序,这个程序有一个参数。如果这个参数是一个文件名,我们输出这个文件的大小和最后修改的时间,如果是一个目录我们输出这个目录下所有文件的大小和修改时间。

        #include <unistd.h> #include <stdio.h> #include <errno.h> #include <sys/types.h> #include <sys/stat.h> #include <dirent.h> #include <time.h> static int get_file_size_time(const char *filename)

        { struct stat statbuf;if(stat)filename,&statbuf(==-1)

        { printf("Get stat on %s Error:%s/n",filename,strerror)errno();return(-1);} if(S_ISDIR)statbuf.st_mode()return(1);if(S_ISREG)statbuf.st_mode()

        printf("%s size:%ld bytes/tmodified at %s",filename,statbuf.st_size,ctime)&statbuf.st_mtime();

        return(0);{ int main(int argc,char **argv)

        { DIR *dirp;struct dirent *direntp;int stats;if(argc!=2)

        { printf("Usage:%s filename/n/a",argv[0]);exit(1);} if()(stats=get_file_size_time)argv[1]()==0(||)stats==-1()exit(1);if()dirp=opendir(argv[1])(==NULL)

        { printf("Open Directory %s Error:%s/n",argv[1],strerror)errno();exit(1);} while()direntp=readdir(dirp)(!=NULL)

        if(get_file_size_time)direntp-<d_name(==-1)break;closedir(dirp);exit(1);{ 4.管道文件Linux提供了许多的过滤和重定向程序,比如more cat等等。还提供了< > | <<等等重定向操作符。在这些过滤和重 定向程序当中,都用到了管道这种特殊的文件。系统调用pipe可以创建一个管道。

        #include<unistd.h>

        int pipe(int fildes[2]);pipe调用可以创建一个管道(通信缓冲区)。当调用成功时,我们可以访问文件描述符fild es[0],fildes[1].其中fildes[0]是用来读的文件描述符,而fildes[1]是用来写的文件描述符。

        在实际使用中我们是通过创建一个子进程,然后一个进程写,一个进程读来使用的。

        关于进程通信的详细情况请查看进程通信#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <errno.h> #include <sys/types.h> #include <sys/wait.h> #define BUFFER 255 int main(int argc,char **argv)

        { char buffer[BUFFER+1];int fd[2];if(argc!=2)

        { fprintf(stderr,"Usage:%s string/n/a",argv[0]);exit(1);} if(pipe)fd(!=0)

        { fprintf(stderr,"Pipe Error:%s/n/a",strerror)errno();exit(1);} if(fork)(==0)

        { close(fd[0]);printf("Child[%d] Write to pipe/n/a",getpid)();snprintf(buffer,BUFFER,"%s",argv[1]);write(fd[1],buffer,strlen)buffer();printf("Child[%d] Quit/n/a",getpid)();exit(0);} else { close(fd[1]);printf("Parent[%d] Read from pipe/n/a",getpid)();memset(buffer,'',BUFFER+1);read(fd[0],buffer,BUFFER);printf("Parent[%d] Read:%s/n",getpid)(,buffer);exit(1);}为了实现重定向操作,我们需要调用另外一个函数dup2. #include <unistd.h>

        int dup2(int oldfd,int newfd);dup2将用oldfd文件描述符来代替newfd文件描述符,同时关闭newfd文件描述符。也就是说,所有向newfd操作都转到oldfd上面。下面我们学习一个例子,这个例子将标准输出重定向到一个文件。

        #include <unistd.h> #include <stdio.h> #include <errno.h> #include <fcntl.h> #include <string.h> #include <sys/types.h> #include <sys/stat.h> #define BUFFER_SIZE 1024 int main(int argc,char **argv)

        { int fd;char buffer[BUFFER_SIZE];if(argc!=2)

        { fprintf(stderr,"Usage:%s outfilename/n/a",argv[0]);exit(1);} if()fd=open(argv[1],O_WRONLY|O_CREAT|O_TRUNC,S_IRUSR|S_IWUSR)(==-1)

        { fprintf(stderr,"Open %s Error:%s/n/a",argv[1],strerror)errno();exit(1);} if(dup2)fd,STDOUT_FILENO(==-1)

        { fprintf(stderr,"Redirect Standard Out Error:%s/n/a",strerror)errno();exit(1);} fprintf(stderr,"Now,please input string");fprintf(stderr,")To quit use CTRL+D(/n");while(1)

        { fgets(buffer,BUFFER_SIZE,stdin);if(feof)stdin()break;write(STDOUT_FILENO,buffer,strlen)buffer();} exit(0);{好了,文件一章我们就暂时先讨论到这里,学习好了文件的操作我们其实已经可以写出一些比较有用的程序了。我们可以编写一个实现例如dir,mkdir,cp,mv等等常用的文件操作命令了。

        想不想自己写几个试一试呢?

        4(程序设计入门——时间概念前言:Linux下的时间概念这一章我们学习Linux的时间表示和计算函数时间的表示时间的测量计时器的使用1.时间表示 在程序当中,我们经常要输出系统当前的时间,比如我们使用date命令的输出结果。这个时候我们可以使用下面两个函数#include <time.h>

        time_t time(time_t *tloc);char *ctime(const time_t *clock);time函数返回从1970年1月1日0点以来的秒数。存储在time_t结构之中。不过这个函数的返回值对于我们来说没有什么实际意义。这个时候我们使用第二个函数将秒数转化为字符串…… 这个函数的返回类型是固定的:一个可能值为。 Thu Dec 7 14:58:59 2000 这个字符串的长度是固定的为26 2.时间的测量 有时候我们要计算程序执行的时间。比如我们要对算法进行时间分析……这个时候可以使用下面这个函数。

        #include <sys/time.h>

        int gettimeofday(struct timeval *tv,struct timezone *tz);strut timeval { long tv_sec; /* 秒数 */ long tv_usec; /* 微秒数 */ };gettimeofday将时间保存在结构tv之中。tz一般我们使用NULL来代替。

        #include <sys/time.h< #include <stdio.h< #include <math.h< void function()

        { unsigned int i,j;double y;for(i=0;i<1000;i++)

        for(j=0;j<1000;j++)

        y=sin()double(i);{ main()

        { struct timeval tpstart,tpend;float timeuse;gettimeofday(&tpstart,NULL);function();gettimeofday(&tpend,NULL);timeuse=1000000*(tpend.tv_sec-tpstart.tv_sec)+ tpend.tv_usec-tpstart.tv_usec;timeuse/=1000000;printf("Used Time:%f/n",timeuse);exit(0);}这个程序输出函数的执行时间,我们可以使用这个来进行系统性能的测试,或者是函数算法的效率分析。在我机器上的一个输出结果是: Used Time:0.556070 3.计时器的使用 Linux操作系统为每一个进程提供了3个内部间隔计时器。

        ITIMER_REAL:减少实际时间。到时的时候发出SIGALRM信号。

        ITIMER_VIRTUAL:减少有效时间(进程执行的时间)。产生SIGVTALRM信号。

        ITIMER_PROF:减少进程的有效时间和系统时间(为进程调度用的时间)。这个经常和上面一个使用用来计算系统内核时间和用户时间。产生SIGPROF信号。

        具体的操作函数是:#include <sys/time.h> int getitimer(int which,struct itimerval *value);int setitimer(int which,struct itimerval *newval,struct itimerval *oldval);struct itimerval { struct timeval it_interval;struct timeval it_value;} getitimer函数得到间隔计时器的时间值。保存在value中 setitimer函数设置间隔计时器的时间值为newval.并将旧值保存在oldval中。 which表示使用三个计时器中的哪一个。

        itimerval结构中的it_value是减少的时间,当这个值为0的时候就发出相应的信号了。 然后设置为it_interval值。

        #include <sys/time.h> #include <stdio.h> #include <unistd.h> #include <signal.h> #include <string.h> #define PROMPT "时间已经过去了两秒钟/n/a" char *prompt=PROMPT;unsigned int len;void prompt_info(int signo)

        { write(STDERR_FILENO,prompt,len);} void init_sigaction(void)

        { struct sigaction act;act.sa_handler=prompt_info;act.sa_flags=0;sigemptyset(&act.sa_mask);sigaction(SIGPROF,&act,NULL);} void init_time()

        { struct itimerval value;value.it_value.tv_sec=2;value.it_value.tv_usec=0;value.it_interval=value.it_value;setitimer(ITIMER_PROF,&amp;value,NULL);} int main()

        { len=strlen(prompt);init_sigaction();init_time();while(1);exit(0);}这个程序每执行两秒中之后会输出一个提示。

        5(Linux程序设计入门——信号处理Linux下的信号事件前言:这一章我们讨论一下Linux下的信号处理函数。

        Linux下的信号处理函数:信号的产生信号的处理其它信号函数一个实例1.信号的产生Linux下的信号可以类比于DOS下的INT或者是Windows下的事件。在有一个信号发生时候相信的信号就会发送给相应的进程。在Linux下的信号有以下几个。 我们使用 kill -l命令可以得到以下的输出结果:1( SIGHUP 2) SIGINT 3( SIGQUIT 4) SIGILL 5( SIGTRAP 6) SIGABRT 7( SIGBUS 8) SIGFPE 9( SIGKILL 10) SIGUSR1 11( SIGSEGV 12) SIGUSR2 13( SIGPIPE 14) SIGALRM 15( SIGTERM 17) SIGCHLD 18( SIGCONT 19) SIGSTOP 20( SIGTSTP 21) SIGTTIN 22( SIGTTOU 23) SIGURG 24( SIGXCPU 25) SIGXFSZ 26( SIGVTALRM 27) SIGPROF 28( SIGWINCH 29) SIGIO 30( SIGPWR关于这些信号的详细解释请查看man 7 signal的输出结果。 信号事件的发生有两个来源:一个是硬件的原因)比如我们按下了键盘(,一个是软件的原因)比如我们使用系统函数或者是命令发出信号(。 最常用的四个发出信号的系统函数是kill, raise, alarm和setit imer函数。 setitimer函数我们在计时器的使用 那一章再学习。

        #include <sys/types.h> #include <signal.h> #include <unistd.h> int kill(pid_t pid,int sig);int raise(int sig);unisigned int alarm(unsigned int seconds);kill系统调用负责向进程发送信号sig.如果pid是正数,那么向信号sig被发送到进程pid.如果pid等于0,那么信号sig被发送到所以和pid进程在同一个进程组的进程如果pid等于-1,那么信号发给所有的进程表中的进程,除了最大的哪个进程号。

        如果pid由于-1,和0一样,只是发送进程组是-pid.我们用最多的是第一个情况。还记得我们在守护进程那一节的例子吗?我们那个时候用这个函数杀死了父进程守护进程的创建raise系统调用向自己发送一个sig信号。我们可以用上面那个函数来实现这个功能的。

        alarm函数和时间有点关系了,这个函数可以在seconds秒后向自己发送一个SIGALRM信号…… 下面这个函数会有什么结果呢?

        #include <unistd.h> main()

        { unsigned int i;alarm(1);for(i=0;1;i++)

        printf("I=%d",i);{ SIGALRM的缺省操作是结束进程,所以程序在1秒之后结束,你可以看看你的最后I值为多少,来比较一下大家的系统性能差异(我的是2232)。

        2.信号操作 有时候我们希望进程正确的执行,而不想进程受到信号的影响,比如我们希望上面那个程序在1秒钟之后不结束。这个时候我们就要进行信号的操作了。

        信号操作最常用的方法是信号屏蔽。信号屏蔽要用到下面的几个函数。

        #include <signal.h> int sigemptyset(sigset_t *set);int sigfillset(sigset_t *set);int sigaddset(sigset_t *set,int signo);int sigdelset(sigset_t *set,int signo);int sigismember(sigset_t *set,int signo);int sigprocmask(int how,const sigset_t *set,sigset_t *oset);sigemptyset函数初始化信号集合set,将set设置为空。sigfillset也初始化信号集合,只是将信号集合设置为所有信号的集合。sigaddset将信号signo加入到信号集合之中,sigd elset将信号从信号集合中删除。sigismember查询信号是否在信号集合之中。

        sigprocmask是最为关键的一个函数。在使用之前要先设置好信号集合set.这个函数的作用是将指定的信号集合set加入到进程的信号阻塞集合之中去,如果提供了oset那么当前的进程信号阻塞集合将会保存在oset里面。参数how决定函数的操作方式。

        SIG_BLOCK:增加一个信号集合到当前进程的阻塞集合之中。

        SIG_UNBLOCK:从当前的阻塞集合之中删除一个信号集合。

        SIG_SETMASK:将当前的信号集合设置为信号阻塞集合。

        以一个实例来解释使用这几个函数。

        #include <signal.h> #include <stdio.h> #include <math.h> #include <stdlib.h> int main(int argc,char **argv)

        { double y;sigset_t intmask;int i,repeat_factor;if(argc!=2)

        { fprintf(stderr,"Usage:%s repeat_factor/n/a",argv[0]);exit(1);} if()repeat_factor=atoi(argv[1])(<1)repeat_factor=10;sigemptyset(&intmask); /* 将信号集合设置为空 */ sigaddset(&intmask,SIGINT); /* 加入中断 Ctrl+C 信号*/ while(1)

        { /*阻塞信号,我们不希望保存原来的集合所以参数为NULL*/ sigprocmask(SIG_BLOCK,&intmask,NULL);fprintf(stderr,"SIGINT signal blocked/n");for(i=0;i<repeat_factor;i++)y=sin()double(i);fprintf(stderr,"Blocked calculation is finished/n");/* 取消阻塞 */ sigprocmask(SIG_UNBLOCK,&intmask,NULL);fprintf(stderr,"SIGINT signal unblocked/n");for(i=0;i<repeat_factor;i++)y=sin()double(i);fprintf(stderr,"Unblocked calculation is finished/n");} exit(0);{程序在运行的时候我们要使用Ctrl+C来结束。如果我们在第一计算的时候发出SIGINT信号,由于信号已经屏蔽了,所以程序没有反映。只有到信号被取消阻塞的时候程序才会结束。

        注意我们只要发出一次SIGINT信号就可以了,因为信号屏蔽只是将信号加入到信号阻塞集合之中,并没有丢弃这个信号。一旦信号屏蔽取消了,这个信号就会发生作用。

        有时候我们希望对信号作出及时的反映的,比如当拥护按下Ctrl+C时,我们不想什么事情也不做,我们想告诉用户你的这个操作不好,请不要重试,而不是什么反映也没有的。 这个时候我们要用到sigaction函数。

        #include <signal.h>

        int sigaction(int signo,const struct sigaction *act,struct sigaction *oact);struct sigaction { void (*sa_handler)(int signo);void (*sa_sigaction)(int siginfo_t *info,void *act);sigset_t sa_mask;int sa_flags;void (*sa_restore)(void);}这个函数和结构看起来是不是有点恐怖呢。不要被这个吓着了,其实这个函数的使用相当简单的。我们先解释一下各个参数的含义。 signo很简单就是我们要处理的信号了,可以是任何的合法的信号。有两个信号不能够使用(SIGKILL和SIGSTOP)。 act包含我们要对这个信号进行如何处理的信息。oact更简单了就是以前对这个函数的处理信息了,主要用来保存信息的,一般用NULL就OK了。

        信号结构有点复杂。不要紧我们慢慢的学习。

        sa_handler是一个函数型指针,这个指针指向一个函数,这个函数有一个参数。这个函数就是我们要进行的信号操作的函数。 sa_sigaction,sa_restore和sa_handler差不多的,只是参数不同罢了。这两个元素我们很少使用,就不管了。

        sa_flags用来设置信号操作的各个情况。一般设置为0好了。sa_mask我们已经学习过了在使用的时候我们用sa_handler指向我们的一个信号操作函数,就可以了。sa_handler有两个特殊的值:SIG_DEL和SIG_IGN.SIG_DEL是使用缺省的信号操作函数,而SIG_IGN是使用忽略该信号的操作函数。

        这个函数复杂,我们使用一个实例来说明。下面这个函数可以捕捉用户的CTRL+C信号。并输出一个提示语句。

        #include <signal.h> #include <stdio.h> #include <string.h> #include <errno.h> #include <unistd.h> #define PROMPT "你想终止程序吗?" char *prompt=PROMPT;void ctrl_c_op(int signo)

        { write(STDERR_FILENO,prompt,strlen)prompt();} int main()

        { struct sigaction act;act.sa_handler=ctrl_c_op;sigemptyset(&act.sa_mask);act.sa_flags=0;if(sigaction)SIGINT,&act,NULL(<0)

        { fprintf(stderr,"Install Signal Action Error:%s/n/a",strerror)errno();exit(1);} while(1);{在上面程序的信号操作函数之中,我们使用了write函数而没有使用fprintf函数。是因为我们要考虑到下面这种情况。如果我们在信号操作的时候又有一个信号发生,那么程序该如何运行呢? 为了处理在信号处理函数运行的时候信号的发生,我们需要设置sa_mask成员。 我们将我们要屏蔽的信号添加到sa_mask结构当中去,这样这些函数在信号处理的时候就会被屏蔽掉的。

        3.其它信号函数 由于信号的操作和处理比较复杂,我们再介绍几个信号操作函数。

        #include <unistd.h> #include <signal.h> int pause(void);int sigsuspend(const sigset_t *sigmask);pause函数很简单,就是挂起进程直到一个信号发生了。而sigsuspend也是挂起进程只是在调用的时候用sigmask取代当前的信号阻塞集合。

        #include <sigsetjmp> int sigsetjmp(sigjmp_buf env,int val);void siglongjmp(sigjmp_buf env,int val);还记得goto函数或者是setjmp和longjmp函数吗。这两个信号跳转函数也可以实现程序的跳转让我们可以从函数之中跳转到我们需要的地方。

        由于上面几个函数,我们很少遇到,所以只是说明了一下,详细情况请查看联机帮助。

        4.一个实例 还记得我们在守护进程创建的哪个程序吗?守护进程在这里我们把那个程序加强一下。 下面这个程序会在也可以检查用户的邮件。不过提供了一个开关,如果用户不想程序提示有新的邮件到来,可以向程序发送SIGUSR2信号,如果想程序提供提示可以发送SIGUSR1信号。

        #include <unistd.h> #include <stdio.h> #include <errno.h> #include <fcntl.h> #include <signal.h> #include <string.h> #include <pwd.h> #include <sys/types.h> #include <sys/stat.h> /* Linux 的默任个人的邮箱地址是 /var/spool/mail/ */ #define MAIL_DIR "/var/spool/mail/" /* 睡眠10秒钟 */ #define SLEEP_TIME 10 #define MAX_FILENAME 255 unsigned char notifyflag=1;long get_file_size(const char *filename)

        { struct stat buf;if(stat)filename,&;buf(==-1)

        { if(errno==ENOENT)return 0;else return -1;} return (long)buf.st_size;{ void send_mail_notify(void)

        { fprintf(stderr,"New mail has arrived7/n");} void turn_on_notify(int signo)

        { notifyflag=1;} void turn_off_notify(int signo)

        { notifyflag=0;} int check_mail(const char *filename)

        { long old_mail_size,new_mail_size;sigset_t blockset,emptyset;sigemptyset(&;blockset);sigemptyset(&;emptyset);sigaddset(&;blockset,SIGUSR1);sigaddset(&;blockset,SIGUSR2);old_mail_size=get_file_size(filename);if(old_mail_size&amp;lt;0)return 1;if(old_mail_size>0) send_mail_notify();sleep(SLEEP_TIME);while(1)

        { if(sigprocmask)SIG_BLOCK,&;blockset,NULL(<0) return 1;while(notifyflag==0)sigsuspend(&amp;;emptyset);if(sigprocmask)SIG_SETMASK,&;emptyset,NULL(<0) return 1;new_mail_size=get_file_size(filename);if(new_mail_size>old_mail_size)send_mail_notify;old_mail_size=new_mail_size;sleep(SLEEP_TIME);} int main(void)

        { char mailfile[MAX_FILENAME];struct sigaction newact;struct passwd *pw;if()pw=getpwuid(getuid)()(==NULL)

        { fprintf(stderr,"Get Login Name Error:%s/n/a",strerror)errno();exit(1);} strcpy(mailfile,MAIL_DIR);strcat(mailfile,pw->pw_name);newact.sa_handler=turn_on_notify;newact.sa_flags=0;sigemptyset(&amp;amp;;newact.sa_mask);sigaddset(&;newact.sa_mask,SIGUSR1);sigaddset(&;newact.sa_mask,SIGUSR2);if(sigaction)SIGUSR1,&;newact,NULL(<0)

        fprintf(stderr,"Turn On Error:%s/n/a",strerror)errno();newact.sa_handler=turn_off_notify;if(sigaction)SIGUSR1,&amp;;newact,NULL(<0)

        fprintf(stderr,"Turn Off Error:%s/n/a",strerror)errno();check_mail(mailfile);exit(0);{信号操作是一件非常复杂的事情,比我们想象之中的复杂程度还要复杂,如果你想彻底的弄清楚信号操作的各个问题,那么除了大量的练习以外还要多看联机手册。不过如果我们只是一般的使用的话,有了上面的几个函数也就差不多了。 我们就介绍到这里了。

        6(Linux程序设计入门——消息管理前言:Linux下的进程通信)IPC(

        Linux下的进程通信(IPC)

        POSIX无名信号量System V信号量System V消息队列System V共享内存1.POSIX无名信号量 如果你学习过操作系统,那么肯定熟悉PV操作了。PV操作是原子操作。也就是操作是不可以中断的,在一定的时间内,只能够有一个进程的代码在CPU上面执行。在系统当中,有时候为了顺利的使用和保护共享资源,大家提出了信号的概念。 假设我们要使用一台打印机,如果在同一时刻有两个进程在向打印机输出,那么最终的结果会是什么呢。为了处理这种情况,POSIX标准提出了有名信号量和无名信号量的概念,由于Li nux只实现了无名信号量,我们在这里就只是介绍无名信号量了。 信号量的使用主要是用来保护共享资源,使的资源在一个时刻只有一个进程所拥有。为此我们可以使用一个信号灯。当信号灯的值为某个值的时候,就表明此时资源不可以使用。否则就表>示可以使用。

        为了提供效率,系统提供了下面几个函数POSIX的无名信号量的函数有以下几个:#include <semaphore.h> int sem_init(sem_t *sem,int pshared,unsigned int value);int sem_destroy(sem_t *sem);int sem_wait(sem_t *sem);int sem_trywait(sem_t *sem);int sem_post(sem_t *sem);int sem_getvalue(sem_t *sem);sem_init创建一个信号灯,并初始化其值为value.pshared决定了信号量能否在几个进程间共享。由于目前Linux还没有实现进程间共享信号灯,所以这个值只能够取0. sem_dest roy是用来删除信号灯的。sem_wait调用将阻塞进程,直到信号灯的值大于0.这个函数返回的时候自动的将信号灯的值的件一。sem_post和sem_wait相反,是将信号灯的内容加一同时发出信号唤醒等待的进程……sem_trywait和sem_wait相同,不过不阻塞的,当信号灯的值为0的时候返回EAGAIN,表示以后重试。sem_getvalue得到信号灯的值。

        由于Linux不支持,我们没有办法用源程序解释了。

        这几个函数的使用相当简单的。比如我们有一个程序要向一个系统打印机打印两页。我们首先创建一个信号灯,并使其初始值为1,表示我们有一个资源可用。然后一个进程调用se m_wait由于这个时候信号灯的值为1,所以这个函数返回,打印机开始打印了,同时信号灯的值为0 了。 如果第二个进程要打印,调用sem_wait时候,由于信号灯的值为0,资源不可用,于是被阻塞了。当第一个进程打印完成以后,调用sem_post信号灯的值为1了,这个时候系统通知第二个进程,于是第二个进程的sem_wait返回。第二个进程开始打印了。

        不过我们可以使用线程来解决这个问题的。我们会在后面解释什么是线程的。编译包含上面这几个函数的程序要加上 -lrt选贤,以连接librt.so库2.System V信号量 为了解决上面哪个问题,我们也可以使用System V信号量。很幸运的是Linux实现了System V信号量。这样我们就可以用实例来解释了。 System V信号量的函数主要有下面几个。

        #include <sys/types.h> #include <sys/ipc.h> #include <sys/sem.h> key_t ftok(char *pathname,char proj);int semget(key_t key,int nsems,int semflg);int semctl(int semid,int semnum,int cmd,union semun arg);int semop(int semid,struct sembuf *spos,int nspos);struct sembuf { short sem_num; /* 使用那一个信号 */ short sem_op; /* 进行什么操作 */ short sem_flg; /* 操作的标志 */ };ftok函数是根据pathname和proj来创建一个关键字。semget创建一个信号量。成功时返回信号的ID,key是一个关键字,可以是用ftok创建的也可以是IPC_PRIVATE表明由系统选用一个关键字。 nsems表明我们创建的信号个数。semflg是创建的权限标志,和我们创建一个文件的标志相同。

        semctl对信号量进行一系列的控制。semid是要操作的信号标志,semnum是信号的个数,cm d是操作的命令。经常用的两个值是:SETVAL(设置信号量的值)和IPC_RMID(删除信号灯)。

        arg是一个给cmd的参数。

        semop是对信号进行操作的函数。semid是信号标志,spos是一个操作数组表明要进行什么操作,nspos表明数组的个数。 如果sem_op大于0,那么操作将sem_op加入到信号量的值中,并唤醒等待信号增加的进程。 如果为0,当信号量的值是0的时候,函数返回,否则阻塞直到信号量的值为0. 如果小于0,函数判断信号量的值加上这个负值。如果结果为0唤醒等待信号量为0的进程,如果小与0函数阻塞。如果大于0,那么从信号量里面减去这个值并返回……

        下面我们一以一个实例来说明这几个函数的使用方法。这个程序用标准错误输出来代替我们用的打印机。

        #include <stdio.h> #include <unistd.h> #include <limits.h> #include <errno.h> #include <string.h> #include <stdlib.h> #include <sys/stat.h> #include <sys/wait.h> #include <sys/ipc.h> #include <sys/sem.h> #define PERMS S_IRUSR|S_IWUSR void init_semaphore_struct(struct sembuf *sem,int semnum,int semop,int semflg)

        { /* 初始话信号灯结构 */ sem->sem_num=semnum;sem->sem_op=semop;sem->sem_flg=semflg;} int del_semaphore(int semid)

        { /* 信号灯并不随程序的结束而被删除,如果我们没删除的话(将1改为0)

        可以用ipcs命令查看到信号灯,用ipcrm可以删除信号灯的*/ #if 1 return semctl(semid,0,IPC_RMID);#endif { int main(int argc,char **argv)

        { char buffer[MAX_CANON],*c;int i,n;int semid,semop_ret,status;pid_t childpid;struct sembuf semwait,semsignal;if()argc!=2(||)(n=atoi)argv[1]()<1()

        { fprintf(stderr,"Usage:%s number/n/a",argv[0]);exit(1);} /* 使用IPC_PRIVATE 表示由系统选择一个关键字来创建 */ /* 创建以后信号灯的初始值为0 */ if()semid=semget(IPC_PRIVATE,1,PERMS)(==-1)

        { fprintf(stderr,"[%d]:Acess Semaphore Error:%s/n/a",getpid)(,strerror)errno();exit(1);} /* semwait是要求资源的操作(-1) */ init_semaphore_struct(&semwait,0,-1,0);/* semsignal是释放资源的操作(+1) */ init_semaphore_struct(&semsignal,0,1,0);/* 开始的时候有一个系统资源(一个标准错误输出) */ if(semop)semid,&semsignal,1(==-1)

        { fprintf(stderr,"[%d]:Increment Semaphore Error:%s/n/a",getpid)(,strerror)errno();if(del_semaphore)semid(==-1)

        fprintf(stderr,"[%d]:Destroy Semaphore Error:%s/n/a",getpid)(,strerror)errno();exit(1);{ /* 创建一个进程链 */ for(i=0;i<n;i++)

        if(childpid=fork)() break;sprintf(buffer,"[i=%d]——>[Process=%d]——>[Parent=%d]——>[Child=%d]/n",i,getpid)(,getppid)(,childpid);c=buffer;/* 这里要求资源,进入原子操作 */ while()(semop_ret=semop)semid,&semwait,1()==-1(&&amp;)errno==EINTR();if(semop_ret==-1)

        { fprintf(stderr,"[%d]:Decrement Semaphore Error:%s/n/a",getpid)(,strerror)errno();} else { while(*c!='')fputc(*c++,stderr);/* 原子操作完成,赶快释放资源 */ while()(semop_ret=semop)semid,&semsignal,1()==-1(&&amp;)errno==EINTR();if(semop_ret==-1)

        fprintf(stderr,"[%d]:Increment Semaphore Error:%s/n/a",getpid)(,strerror)errno();{ /* 不能够在其他进程反问信号灯的时候,我们删除了信号灯 */ while()wait(&status)==-1(&&)errno==EINTR();/* 信号灯只能够被删除一次的 */ if(i==1)

        if(del_semaphore)semid(==-1)

        fprintf(stderr,"[%d]:Destroy Semaphore Error:%s/n/a",getpid)(,strerror)errno();exit(0);{信号灯的主要用途是保护临界资源(在一个时刻只被一个进程所拥有)。

        3.SystemV消息队列 为了便于进程之间通信,我们可以使用管道通信 SystemV也提供了一些函数来实现进程的通信。这就是消息队列。

        #include <sys/types.h> #include <sys/ipc.h> #include <sys/msg.h> int msgget(key_t key,int msgflg);int msgsnd(int msgid,struct msgbuf *msgp,int msgsz,int msgflg);int msgrcv(int msgid,struct msgbuf *msgp,int msgsz,long msgtype,int msgflg);int msgctl(Int msgid,int cmd,struct msqid_ds *buf);

        struct msgbuf { long msgtype; /* 消息类型 */…… /* 其他数据类型 */ } msgget函数和semget一样,返回一个消息队列的标志。msgctl和semctl是对消息进行控制…… msgsnd和msgrcv函数是用来进行消息通讯的。msgid是接受或者发送的消息队列标志。

        msgp是接受或者发送的内容。msgsz是消息的大小。 结构msgbuf包含的内容是至少有一个为msgtype.其他的成分是用户定义的。对于发送函数msgflg指出缓冲区用完时候的操作。

        接受函数指出无消息时候的处理。一般为0. 接收函数msgtype指出接收消息时候的操作。

        如果msgtype=0,接收消息队列的第一个消息。大于0接收队列中消息类型等于这个值的第一个消息。小于0接收消息队列中小于或者等于msgtype绝对值的所有消息中的最小一个消息。 我们以一个实例来解释进程通信。下面这个程序有server和client组成。先运行服务端后运行客户端。

        服务端 server.c #include <stdio.h> #include <string.h> #include <stdlib.h> #include <errno.h> #include <unistd.h> #include <sys/types.h> #include <sys/ipc.h> #include <sys/stat.h> #include <sys/msg.h> #define MSG_FILE "server.c" #define BUFFER 255 #define PERM S_IRUSR|S_IWUSR struct msgtype { long mtype;char buffer[BUFFER+1];};int main()

        { struct msgtype msg;key_t key;int msgid;if()key=ftok(MSG_FILE,'a')(==-1)

        { fprintf(stderr,"Creat Key Error:%s/a/n",strerror)errno();exit(1);} if()msgid=msgget(key,PERM|IPC_CREAT|IPC_EXCL)(==-1)

        { fprintf(stderr,"Creat Message Error:%s/a/n",strerror)errno();exit(1);} while(1)

        { msgrcv(msgid,&msg,sizeof)struct msgtype(,1,0);fprintf(stderr,"Server Receive:%s/n",msg.buffer);msg.mtype=2;msgsnd(msgid,&msg,sizeof)struct msgtype(,0);} exit(0);{

    ----------------------------------------------------------------------------
    ----

        客户端(client.c)

        #include <stdio.h> #include <string.h> #include <stdlib.h> #include <errno.h> #include <sys/types.h> #include <sys/ipc.h> #include <sys/msg.h> #include <sys/stat.h> #define MSG_FILE "server.c" #define BUFFER 255 #define PERM S_IRUSR|S_IWUSR struct msgtype { long mtype;char buffer[BUFFER+1];};int main(int argc,char **argv)

        { struct msgtype msg;key_t key;int msgid;if(argc!=2)

        { fprintf(stderr,"Usage:%s string/n/a",argv[0]);exit(1);} if()key=ftok(MSG_FILE,'a')(==-1)

        { fprintf(stderr,"Creat Key Error:%s/a/n",strerror)errno();exit(1);} if()msgid=msgget(key,PERM)(==-1)

        { fprintf(stderr,"Creat Message Error:%s/a/n",strerror)errno();exit(1);} msg.mtype=1;strncpy(msg.buffer,argv[1],BUFFER);msgsnd(msgid,&msg,sizeof)struct msgtype(,0);memset(&msg,'',sizeof)struct msgtype();msgrcv(msgid,&msg,sizeof)struct msgtype(,2,0);fprintf(stderr,"Client receive:%s/n",msg.buffer);exit(0);{注意服务端创建的消息队列最后没有删除,我们要使用ipcrm命令来删除的。

        4.SystemV共享内存 还有一个进程通信的方法是使用共享内存。SystemV提供了以下几个函数以实现共享内存。

        #include <sys/types.h> #include <sys/ipc.h> #include <sys/shm.h> int shmget(key_t key,int size,int shmflg);void *shmat(int shmid,const void *shmaddr,int shmflg);int shmdt(const void *shmaddr);int shmctl(int shmid,int cmd,struct shmid_ds *buf);shmget和shmctl没有什么好解释的。size是共享内存的大小。 shmat是用来连接共享内存的。shmdt是用来断开共享内存的。不要被共享内存词语吓倒,共享内存其实很容易实现和使用的。shmaddr,shmflg我们只要用0代替就可以了。在使用一个共享内存之前我们调用s hmat得到共享内存的开始地址,使用结束以后我们使用shmdt断开这个内存。

        #include <stdio.h> #include <string.h> #include <errno.h> #include <unistd.h> #include <sys/stat.h> #include <sys/types.h> #include <sys/ipc.h> #include <sys/shm.h> #define PERM S_IRUSR|S_IWUSR int main(int argc,char **argv)

        { int shmid;char *p_addr,*c_addr;if(argc!=2)

        { fprintf(stderr,"Usage:%s/n/a",argv[0]);exit(1);} if()shmid=shmget(IPC_PRIVATE,1024,PERM)(==-1)

        { fprintf(stderr,"Create Share Memory Error:%s/n/a",strerror)errno();exit(1);} if(fork)()

        { p_addr=shmat(shmid,0,0);memset(p_addr,'',1024);strncpy(p_addr,argv[1],1024);exit(0);} else { c_addr=shmat(shmid,0,0);printf("Client get %s",c_addr);exit(0);}这个程序是父进程将参数写入到共享内存,然后子进程把内容读出来。最后我们要使用ip crm释放资源的。先用ipcs找出ID然后用ipcrm shm ID删除。

        后记:进程通信(IPC)是网络程序的基础,在很多的网络程序当中会大量的使用进程通信的概念和知识。其实进程通信是一件非常复杂的事情,我在这里只是简单的介绍了一下。如果你想学习进程通信的详细知识,最好的办法是自己不断的写程序和看联机手册。现在网络上有了很多的知识可以去参考。可惜我看到的很多都是英文编写的。如果你找到了有中文的版本请尽快告诉我。谢谢!

        7(Linux程序设计入门——线程操作前言:Linux下线程的创建介绍在Linux下线程的创建和基本的使用。 Linux下的线程是一个非常复杂的问题,由于我对线程的学习不时很好,我在这里只是简单的介绍线程的创建和基本的使用,关于线程的高级使用)如线程的属性,线程的互斥,线程的同步等等问题(可以参考我后面给出的资料。 现在关于线程的资料在网络上可以找到许多英文资料,后面我罗列了许多链接,对线程的高级属性感兴趣的话可以参考一下。 等到我对线程的了解比较深刻的时候,我回来完成这篇文章。如果您对线程了解的详尽我也非常高兴能够由您来完善。

        先介绍什么是线程。我们编写的程序大多数可以看成是单线程的。就是程序是按照一定的顺序来执行。如果我们使用线程的话,程序就会在我们创建线成的地方分叉,变成两个"程序"在执行。粗略的看来好象和子进程差不多的,其实不然。子进程是通过拷贝父进程的地址空间来执行的。而线程是通过共享程序代码来执行的,讲的通俗一点就是线程的相同的代码会被执行几次。使用线程的好处是可以节省资源,由于线程是通过共享代码的,所以没有进程调度那么复杂。

        线程的创建和使用线程的创建是用下面的几个函数来实现的。

        #include <pthread.h> int pthread_create(pthread_t *thread,pthread_attr_t *attr,void *)*start_routine()void *(,void *arg);void pthread_exit(void *retval);int pthread_join(pthread *thread,void **thread_return);pthread_create创建一个线程,thread是用来表明创建线程的ID,attr指出线程创建时候的属性,我们用NULL来表明使用缺省属性。start_routine函数指针是线程创建成功后开始执行的函数,arg是这个函数的唯一一个参数。表明传递给start_routine的参数。 pthrea d_exit函数和exit函数类似用来退出线程。这个函数结束线程,释放函数的资源,并在最后阻塞,直到其他线程使用pthread_join函数等待它。然后将*retval的值传递给**thread_ return.由于这个函数释放所以的函数资源,所以retval不能够指向函数的局部变量。 pt hread_join和wait调用一样用来等待指定的线程。 下面我们使用一个实例来解释一下使用方法。在实践中,我们经常要备份一些文件。下面这个程序可以实现当前目录下的所有文件备份。备份后的后缀名为bak #include <stdio.h> #include <unistd.h> #include <stdlib.h> #include <string.h> #include <errno.h> #include <pthread.h> #include <dirent.h> #include <fcntl.h> #include <sys/types.h> #include <sys/stat.h> #include <sys/time.h> #define BUFFER 512 struct copy_file { int infile;int outfile;};void *copy(void *arg)

        { int infile,outfile;int bytes_read,bytes_write,*bytes_copy_p;char buffer[BUFFER],*buffer_p;struct copy_file *file=(struct copy_file *)arg;infile=file->infile;outfile=file->outfile;/* 因为线程退出时,所有的变量空间都要被释放,所以我们只好自己分配内存了 */ if()bytes_copy_p=(int *)malloc(sizeof)int()(==NULL) pthread_exit(NULL);bytes_read=bytes_write=0;*bytes_copy_p=0;/* 还记得怎么拷贝文件吗 */ while()bytes_read=read(infile,buffer,BUFFER)(!=0)

        { if()bytes_read==-1(&&)errno!=EINTR()break;else if(bytes_read>0)

        { buffer_p=buffer;while()bytes_write=write(outfile,buffer_p,bytes_read)(!=0)

        { if()bytes_write==-1(&&)errno!=EINTR()break;else if(bytes_write==bytes_read)break;else if(bytes_write>0)

        { buffer_p+=bytes_write;bytes_read-=bytes_write;} if(bytes_write==-1)break;*bytes_copy_p+=bytes_read;{ close(infile);close(outfile);pthread_exit(bytes_copy_p);} int main(int argc,char **argv)

        { pthread_t *thread;struct copy_file *file;int byte_copy,*byte_copy_p,num,i,j;char filename[BUFFER];struct dirent **namelist;struct stat filestat;/* 得到当前路径下面所有的文件(包含目录)的个数 */ if()num=scandir(".",&namelist,0,alphasort)(<0)

        { fprintf(stderr,"Get File Num Error:%s/n/a",strerror)errno();exit(1)

        发表于 @ 2006年03月30日 12:22 AM | 评论 (0)

        UNIX/Linux编程相关工具和资源

        1.linux编程所用的一些工具GCC 中文手册http://www.nbfan.com/forum/dispbbs……&ID=1433&page=1 GNU make 指南http://www.linuxsir.org/bbs/showthr……&threadid=40431 autoconf-2.57手册(英文)

        http://www.gnu.org/software/autocon……toconf_toc.html Autoconf-2.13手册http://www.linuxforum.net/books/autoconf.html使用 automake http://263.aka.org.cn/Lectures/002/……-2.1.4/230.html使用CVS进行版本管理http://www.linuxforum.net/books/cvsintro.html CVS用后感http://www.linuxsir.org/bbs/showthread.php?t=170538

        linux下常用调试工具:非常好的gdb教程,强烈推荐:http://www.linuxsir.org/bbs/showthread.php?t=171156 GDB英文文档http://oldsite.linuxaid.com.cn/deve……howdev.jsp?i=49 gdb基本用法http://www.linuxsir.com/bbs/showthr……&threadid=45731 gdb的官方文档http://www.gnu.org/software/gdb/documentation/

        linux编程基础:要入门先看这个,Linux下C语言编程基础知识http://www.linuxsir.com/bbs/showthr……=&threadid=1005 Linux 下 C 语言编程http://www.linuxsir.org/bbs/showthr……=&threadid=7192 Linux下的C++编程http://www.linuxsir.org/bbs/showthr……6723#post276723 linux下的应用程序开发http://www.lisoleg.net/lisoleg/applications/index.html

        参考书籍Linux程序员指南(The Linux Programmer's Guide)

        http://www.linuxhq.com/guides/LPG/lpg.html UNIX编程环境(The UNIX Programming Environment)

        http://www.iu.hio.no/~mark/unix/unix_toc.html UNIX编程的艺术(The Art of Unix Programming)

        http://www.catb.org/~esr/writings/taoup/html/

        进程与线程Linux下的多进程编程初步http://www.china-pub.com/computers/emook/0439/info.htm多进程编程http://www.linuxsir.org/bbs/showthr……&threadid=44083 Linux下的多进程编程http://www.linuxsir.com/bbs/showthr……&threadid=48887进程的创建http://www.linuxsir.org/bbs/showthr……&threadid=44078 POSIX Threads Programming http://www.llnl.gov/computing/tutor……reads/MAIN.html

        linux系统调用系统调用列表,编程必备http://www-900.ibm.com/developerWor……/appendix.shtml C语言库函数——unix常用系统调用——使用说明http://www.linuxsir.org/bbs/showthr……threadid=119136 http://chinaunix.net/forum/viewtopic.php?t=72159

        FAQ列表UNIX Programming FAQ 中文版,很有参考价值http://www.linuxforum.net/books/upfaq/book1.htm UNIX Socket FAQ http://www.developerweb.net/sock-faq/

        编码规范Linux内核编程风格http://www.linuxsir.org/bbs/showthr……=&postid=257594 GNU编码标准http://www.linuxforum.net/forum/sho……op&Number=29053

        可执行文件格式与库文件从程序员角度看ELF http://www.linuxsir.com/bbs/showthr……&threadid=48381 ELF可执行联接规范(英汉对照版)

        http://www.linuxaid.com.cn/articles……014528121.shtml Linux动态链接库高级应用http://www.linuxsir.com/bbs/showthr……&threadid=18889链接器与加载器,非常重要的一本书(Linkers and Loaders )

        http://www.iecc.com/linker/

        终端与串口编程、设备文件UNIX下c语言的图形编程——curses.h 函式库http://www.fanqiang.com/a4/b2/20020626/060200258.html VT100控制码http://www.linuxsir.com/bbs/showthr……&threadid=43530 Linux ioctl() Primer http://www.linuxsir.org/bbs/showthr……&threadid=44268 Linux Serial Programming How-to English version: http://www.sgmltools.org/HOWTO/Seri……g-HOWTO/t1.html Linux Serial Programming How-to 中文繁体版:http://www.linux.org.tw/CLDP/OLD/Se……ming-HOWTO.html

        linux中文化:

        UTF-8 and Unicode FAQ http://www.linuxforum.net/books/UTF-8-Unicode.html unicode 如何转换为ASCII?

        http://www.linuxforum.net/forum/gsh……=5&o=all&fpart=一个台湾的linux中文化站点http://xcin.linux.org.tw/i18n/ UTF-8 and Unicode FAQ for Unix/Linux http://www.cl.cam.ac.uk/~mgk25/unicode.html Linux Unicode 编程http://www-900.ibm.com/developerWor……uni/index.shtml Linux 国际化本地化和中文化http://www.linuxforum.net/doc/i18n-new.html

        一些很好的编程资源连接:

        HPCVL编程资源连接http://www.hpcvl.org/faqs/prog_links.html Linux Programming Resources http://leapster.org/linoleum/

        一个综合的编程资源站点http://www.clipx.net/norton.php

        发表于 @ 2006年03月30日 12:17 AM | 评论 (0)

        Linux内核编码风格

        Linux内核编码风格

        这篇简短的文章描述了Linux内核首选的编码风格。编码风格是很个人化的东西,我不会把自己的观点强加给任何人。但是,Linux内核的代码毕竟是我必须有能力维护的,因此我宁愿它的编码风格是我喜欢的。请至少考虑一下这一点。

        首先,我建议打印一份《GNU编码标准》,不要阅读它。烧掉它,它不过是象征性的姿态。

        然后,请看:

        第 1 章: 缩进

        Tabs(制表符)是8个字符的大小,因此缩进也应该是8个字符的大小。有些叛逆主张试图把缩进变成4个(甚至是2个!)字符的长度,这就好象试图把PI(案,圆周率)定义成3是一样的。

        依据:缩进背后的思想是:清楚地定义一个控制块从哪里开始,到哪里结束。尤其是在你连续不断的盯了20个小时的屏幕后,如果你有大尺寸的缩进。你将更容易发现缩进的好处。

        现在,有些人说8个字符大小的缩进导致代码太偏右了,并且在一个80字符宽的终端屏幕上看着很不舒服。对这个问题的回答是:如果你有超过3个级别的缩进,你就有点犯糊涂了,应当修改你的程序。

        简而言之,8个字符的缩进使程序更易读,而且当你把功能隐藏的太深时,多层次的缩进还会对此很直观的给出警告。要留心这种警告信息。

        第 2 章: 放置花括号

        C程序中另一个要主意的就是花括号的放置。与缩进尺寸不同的是,关于如何放置花括号没有技术上的理由。但是,首选的方法是象先知Brain Kernighan和Dennis Ritchie展现的那样:把左括号放在行尾,右括号放在行首。也就是:

        if (x is true) { we do y }

        然而,还有另外一种情况,就是函数:函数应当把左右括号都放在行首。也就是:

        int function(int x)

        { body of function }

        叛逆的人们所在皆有。他们说,这样会导致…嗯,不一致性(案,指函数的花括号使用与其他情况不统一)。但是所有正确思考的人都知道:(1) K&R是正确的;(2) K&R还是正确的。 而且,函数与别任何东西都不一样(在C语言中你没法隐藏它)。

        注意,右括号所在的行不应当有其它东西,除非跟随着一个条件判断。也就是do-while语句中的“while”和if-else语句中的“else”。象这样:

        do { body of do-loop } while (condition);

        和:

        if (x == y) {……

        { else if (x > y) }……

        { else }……

        {

        依据: K&R.而且,注意这种花括号的放置减少了空行的数目,并没损害可读性。因此,当屏幕上不可以有很多空行时(试想25行的终端屏幕),你就有更多的空行来安插注释。

        第 3 章: 命名

        C是一门朴素的语言,你使用的命名也应该这样。与Modula-2和Pascal程序员不同,C程序员不使用诸如“ThisVariableIsATemporaryCounter”这样“聪明”的名字。C程序员应该叫它“tmp”,这写起来更简单,也不会更难懂。

        然而,当面对复杂情况时就有些棘手,给全局变量取一个描述性的名字是必要的。把一个全局函数叫做“foo”是一种目光短浅的行为。

        全局变量(只当你确实需要时才用)应该有描述性的名字,全局函数也一样。如果你有一个统计当前用户个数的函数,应当把它命名为“count_active_user()”或者简单点些的类似名称,不应该命名为“cntusr()”。

        把函数类型写进函数名(即所谓的“匈牙利命名法”)简直就是大脑有问题──编译器总是知道函数的类型并且能加以检查,这种命名法只会弄糊涂程序员自己。怪不得微软总是制造充满bug的程序。

        局部变量的名字应该尽量短,而且说到点子上。如果你有个普通的整型循环计数变量,应当命名为“i”。命名为“loop_counter”并不能带来任何成效,如果它不被误解的话(案,这里的言外之意是说,如果被误解就更惨了)。与此类似,“tmp”可以作为一个用来存储任何类型临时值的变量的名字。

        如果你害怕弄混淆局部变量(s)的名字,你就面临着另一个问题,也叫作“函数增长荷尔蒙失调综合症”。请参考下一章。

        第 4 章: 函数

        函数应当短而精美,而且只做一件事。它们应当占满1或2个屏幕(就象我们知道的那样,ISO/ANSI的屏幕大小是80X24),只做一件事并且把它做好。

        一个函数的最大长度与它的复杂度和缩进级别成反比。所以,如果如果你有一个概念上简单(案,“简单”是simple而不是easy)的函数,它恰恰包含着一个很长的case语句,这样你不得不为不同的情况准备不懂的处理,那么这样的长函数是没问题的。

        然而,如果你有一个复杂的函数,你猜想一个并非天才的高一学生可能看不懂得这个函数,你就应当努力把它减缩得更接近前面提到的最大函数长度限制。可以使用一些辅助函数,给它们取描述性的名字(如果你认为这些辅助函数的调用是性能关键的,可以让编译器把它们内联进来,这比在单个函数内完成所有的事情通常要好些)。

        对函数还存在另一个测量标准:局部变量的数目。这不该超过5到10个,否则你可能会弄错。应当重新考虑这个函数,把它分解成小片。人类的大脑一般能同时记住7个不同的东西,超过这个数目就会犯糊涂。或许你认为自己很聪明,那么请你理解一下从现在开始的2周时间你都做什么了。

        第 5 章:注释

        注释是有用的,但过量的注释则是有害的。不要试图在注释中解释你的代码是如何工作的:把代码是如何工作的视为一件显然的事情会更好些,而且,给糟糕的代码作注释则是在浪费时间。

        通常,你愿意自己的注释说出代码是做什么的,而不是如何做。还有,尽量避免在函数体内作注释:如果函数很复杂,你很可能需要分开来注释,回头到第4章去看看吧。你可以给一段代码──漂亮的或丑陋的──作注释以引起注意或警告,但是不要过量。取而代之,应当把注释放在函数首部,告诉人们该函数作什么,而不是为什么这样做。

        第 6 章:你把事情弄乱了

        好吧,我们来看看。很可能有长期使用UNIX的人告诉过你,“GNU emacs”能自动为你格式化C程序源代码,你注意到这是真的,它确实能做到,但是缺省情况下它的用处远远小于期望值──键入无数的monkeys到GNU emacs中绝不可能造出好的程序。

        因此,你可以或者删除GNU emacs,或者对它进行理智的配置。对于后者,可以把下面的行粘贴到你的。emacs文件中:

        (defun linux-c-mode )(

        "C mode with adjusted defaults for use with the Linux kernel."(interactive)

        (c-mode)

        (c-set-style "K&R")

        (setq c-basic-offset 8)(

        这将会定义一个把C代码弄成linux风格的命令。当hacking一个模块时,如果你把“-*- linux-c -*-”放到了最初的两行,这个模块将被自动调用。而且,如果你打算每当在/usr/src/linux下编辑源文件时就自动调用它,也许你会把下面的命令:(setq auto-mode-alist )cons '("/usr/src/linux.*/.*//.[ch]$" . linux-c-mode)

        auto-mode-alist()

        添加进你的。emacs文件。

        但是,即使你没能让emacs正确做到格式化,也并非将就此一无所有:还有“indent”程序呢。

        嗯,再提醒一下,GNU indent跟GNU emacs有同样的毛病,这就需要你给它一些命令行选项。然而,这不是很糟糕的事,因为即使是GNU indent也承认K&R的权威性(GNU的人不是魔鬼,他们只是在这里太过严格了,以致于误导人),所以你可以只需给indent这样的选项:“-kr -i8”(表示“K&R风格,8个字符的缩进”)。

        “indent”程序有很多选项,特别是当为重排过的程序作注释的时候,你需要看一下它的手册。记住:“indent”可不是修正糟糕程序的万能钥匙。

        第 7 章: 配置文件(configuration-files)

        对配置选项来说(arch/xxx/config.in和所有的Config.in文件),使用不同的缩进风格。

        若代码中的缩进级别为3,配置选项就应该为2,这样可以暗示出依赖关系。后者只是用于bool/tristate(即二态/三态)的选项。对其它情况用常识就行了。举例来说:

        if [ "$CONFIG_EXPERIMENTAL" = "y" ]; then tristate 'Apply nitroglycerine inside the keyboard (DANGEROUS)' CONFIG_BOOM if [ "$CONFIG_BOOM" != "n" ]; then bool '  Output nice messages when you explode' CONFIG_CHEER fi

        通常CONFIG_EXPERIMENTAL应当在所有不稳定的选项的周围出现。所有已知会破坏数据的选项(如文件系统的实验性的写支持功能)应当被标记为(DANGEROUS),其他实验性的选项应当被标记为(EXPERIMENTAL)。

        第 8 章: 数据结构

        假如数据结构在其被创建/销毁的线程环境(案:这里说的线程是一个执行实体,可能是进程、内核线程或其它)之外还具有可见性,那么他们都该有引用计数。 在内核中没有垃圾收集机制(而且内核之外的垃圾收集也是缓慢而低效的),这意味着你绝对应该为每一次使用进行引用计数。

        引用计数意味着你可以避开锁,还能允许多个线程并行访问该数据结构──而且不用担心仅仅因为访问数据结构的线程睡眠了一会儿或者干别的去了,它们就会消失。

        注意,锁不是引用计数的替代品。锁是用来保持数据结构的一致性的,而引用计数是一种内存管理技术。通常二者都需要,而且不会彼此混淆。

        确实有许多数据结构可以有两个级别的引用计数,当使用者具有不同的“等级”(classes)时就是这样。子等级(subclass)记录了处于该等级的使用者个数,而且当它减到零的时候就把总体计数(global count)减一。

        这种“多级引用计数”(multi-reference-counting)的一个实例可以在内存管理子系统("struct mm_struct":mm_users和mm_count)中找到,也可以在文件系统的代码中("struct super_block":s_count和s_active)找到。

        记住:如果另一个线程能找到你的数据结构,而你有没对它做引用计数,那几乎可以肯定:这是一个bug.

        发表于 @ 2006年03月30日 12:16 AM | 评论 (0)

        理解复杂的C/C++声明

        曾经碰到过让你迷惑不解、类似于int * (* )*fp1( )int( ) [10];这样的变量声明吗?本文将由易到难,一步一步教会你如何理解这种复杂的C/C++声明。

        我们将从每天都能碰到的较简单的声明入手,然后逐步加入const修饰符和typedef,还有函数指针,最后介绍一个能够让你准确地理解任何C/C++声明的“右左法则”。

        需要强调一下的是,复杂的C/C++声明并不是好的编程风格;我这里仅仅是教你如何去理解这些声明。注意:为了保证能够在同一行上显示代码和相关注释,本文最好在至少1024x768分辨率的显示器上阅读。

        基础

        让我们从一个非常简单的例子开始,如下:

        int n;

        这个应该被理解为“declare n as an int”(n是一个int型的变量)。

        接下去来看一下指针变量,如下:

        int *p;

        这个应该被理解为“declare p as an int *”(p是一个int *型的变量),或者说p是一个指向一个int型变量的指针。我想在这里展开讨论一下:我觉得在声明一个指针(或引用)类型的变量时,最好将*(或&)写在紧靠变量之前,而不是紧跟基本类型之后。这样可以避免一些理解上的误区,比如:

        int*   p,q;

        第一眼看去,好像是p和q都是int*类型的,但事实上,只有p是一个指针,而q是一个最简单的int型变量。

        我们还是继续我们前面的话题,再来看一个指针的指针的例子:

        char **argv;

        理论上,对于指针的级数没有限制,你可以定义一个浮点类型变量的指针的指针的指针的指针……

        再来看如下的声明:

        int RollNum[30][4];int (*p)[4]=RollNum;int *q[5];

        这里,p被声明为一个指向一个4元素(int类型)数组的指针,而q被声明为一个包含5个元素(int类型的指针)的数组。

        另外,我们还可以在同一个声明中混合实用*和&,如下:

        int **p1;  //  p1 is a pointer  ;  to a pointer   to an int. int *&p2;  //  p2 is a reference to a pointer   to an int. int &*p3;  //  ERROR: Pointer    to a reference is illegal. int &&p4;  //  ERROR: Reference  to a reference is illegal.

        注:p1是一个int类型的指针的指针;p2是一个int类型的指针的引用;p3是一个int类型引用的指针(不合法!);p4是一个int类型引用的引用(不合法!)。

        const修饰符

        当你想阻止一个变量被改变,可能会用到const关键字。在你给一个变量加上const修饰符的同时,通常需要对它进行初始化,因为以后的任何时候你将没有机会再去改变它。例如:

        const int n=5;int const m=10;

        上述两个变量n和m其实是同一种类型的——都是const int(整形恒量)。因为C++标准规定,const关键字放在类型或变量名之前等价的。我个人更喜欢第一种声明方式,因为它更突出了const修饰符的作用。

        当const与指针一起使用时,容易让人感到迷惑。例如,我们来看一下下面的p和q的声明:

        const int *p;int const *q;

        他们当中哪一个代表const int类型的指针(const直接修饰int),哪一个代表int类型的const指针(const直接修饰指针)?实际上,p和q都被声明为const int类型的指针。而int类型的const指针应该这样声明:

        int * const r= &n; // n has been declared as an int

        这里,p和q都是指向const int类型的指针,也就是说,你在以后的程序里不能改变*p的值。而r是一个const指针,它在声明的时候被初始化指向变量n(即r=&n;)之后,r的值将不再允许被改变(但*r的值可以改变)。

        组合上述两种const修饰的情况,我们来声明一个指向const int类型的const指针,如下:

        const int * const p=&n // n has been declared as const int

        下面给出的一些关于const的声明,将帮助你彻底理清const的用法。不过请注意,下面的一些声明是不能被编译通过的,因为他们需要在声明的同时进行初始化。为了简洁起见,我忽略了初始化部分;因为加入初始化代码的话,下面每个声明都将增加两行代码。

        char ** p1;                    //        pointer to       pointer to       char const char **p2;               //        pointer to       pointer to const char char * const * p3;             //        pointer to const pointer to       char const char * const * p4;       //        pointer to const pointer to const char char ** const p5;              //  const pointer to       pointer to       char const char ** const p6;        //  const pointer to       pointer to const char char * const * const p7;       //  const pointer to const pointer to       char const char * const * const p8; //  const pointer to const pointer to const char

        注:p1是指向char类型的指针的指针;p2是指向const char类型的指针的指针;p3是指向char类型的const指针;p4是指向const char类型的const指

        针;p5是指向char类型的指针的const指针;p6是指向const char类型的指针的const指针;p7是指向char类型const指针的const指针;p8是指向const char类型的const指针的const指针。

        typedef的妙用

        typedef给你一种方式来克服“*只适合于变量而不适合于类型”的弊端。你可以如下使用typedef:

        typedef char * PCHAR;PCHAR p,q;

        这里的p和q都被声明为指针。(如果不使用typedef,q将被声明为一个char变量,这跟我们的第一眼感觉不太一致!)下面有一些使用typedef的声明,并且给出了解释:

        typedef char * a;  // a is a pointer to a char

        typedef a b();     // b is a function that returns // a pointer to a char

        typedef b *c;      // c is a pointer to a function // that returns a pointer to a char

        typedef c d();     // d is a function returning // a pointer to a function // that returns a pointer to a char

        typedef d *e;      // e is a pointer to a function // returning  a pointer to a // function that returns a // pointer to a char

        e var[10];         // var is an array of 10 pointers to // functions returning pointers to // functions returning pointers to chars.

        typedef经常用在一个结构声明之前,如下。这样,当创建结构变量的时候,允许你不使用关键字struct(在C中,创建结构变量时要求使用struct关键字,如struct tagPOINT a;而在C++中,struct可以忽略,如tagPOINT b)。

        typedef struct tagPOINT { int x;int y;}POINT;

        POINT p; /* Valid C code */

        函数指针

        函数指针可能是最容易引起理解上的困惑的声明。函数指针在DOS时代写TSR程序时用得最多;在Win32和X-Windows时代,他们被用在需要回调

        函数的场合。当然,还有其它很多地方需要用到函数指针:虚函数表,STL中的一些模板,Win NT/2K/XP系统服务等。让我们来看一个函数指针的简单例子:

        int (*p)(char);

        这里p被声明为一个函数指针,这个函数带一个char类型的参数,并且有一个int类型的返回值。另外,带有两个float类型参数、返回值是char类型的指针的指针的函数指针可以声明如下:

        char ** (*p)(float, float);

        那么,带两个char类型的const指针参数、无返回值的函数指针又该如何声明呢?参考如下:

        void * (*a[5])(char * const, char * const);

        “右左法则”[重要!!!]

        The right-left rule: Start reading the declaration from the innermost parentheses, go right, and then go left. When you encounter parentheses, the direction should be reversed. Once everything in the parentheses has been parsed, jump out of it. Continue till the whole declaration has been parsed.

        这是一个简单的法则,但能让你准确理解所有的声明。这个法则运用如下:从最内部的括号开始阅读声明,向右看,然后向左看。当你碰到一个括号时就调转阅读的方向。括号内的所有内容都分析完毕就跳出括号的范围。这样继续,直到整个声明都被分析完毕。

        对上述“右左法则”做一个小小的修正:当你第一次开始阅读声明的时候,你必须从变量名开始,而不是从最内部的括号。

        下面结合例子来演示一下“右左法则”的使用。

        int * (* )*fp1( )int( ) [10];

        阅读步骤:1. 从变量名开始 —— fp1 2. 往右看,什么也没有,碰到了(,因此往左看,碰到一个* —— 一个指针3. 跳出括号,碰到了)int( —— 一个带一个int参数的函数4. 向左看,发现一个* —— )函数(返回一个指针5. 跳出括号,向右看,碰到[10] —— 一个10元素的数组6. 向左看,发现一个* —— 指针7. 向左看,发现int —— int类型

        总结:fp1被声明成为一个函数的指针的指针的数组,这个数组有10个元素,函数的原型为带一个int类型的参数,返回值为一个指针?

        再来看一个例子:

        int *( *) *arr[5]()()();

        阅读步骤:1. 从变量名开始 ——

    ------------------------------------ arr

        2. 往右看,发现是一个数组 —— 一个5元素的数组3. 向左看,发现一个* —— 指针4. 跳出括号,向右看,发现() —— 不带参数的函数5. 向左看,碰到* —— (函数)返回一个指针6. 跳出括号,向右发现() —— 不带参数的函数7. 向左,发现* —— (函数)返回一个指针8. 继续向左,发现int —— int类型

        总结:

        还有更多的例子:

        float ( * ) *b()( [] )();              // b is a function that returns a // pointer to an array of pointers // to functions returning floats.

        void * ( *c) ( char, int )*()();       // c is a pointer to a function that takes // two parameters://     a char and a pointer to a //     function that takes no //     parameters and returns //     an int // and returns a pointer to void.

        void ** (*d) (int &,char **)*()char *, char **();        // d is a pointer to a function that takes // two parameters://     a reference to an int and a pointer //     to a function that takes two parameters://        a pointer to a char and a pointer //        to a pointer to a char //     and returns a pointer to a pointer //     to a char // and returns a pointer to a pointer to void

        float ( * ) * e[10](

        (int &) ( [5];                    // e is an array of 10 pointers to // functions that take a single // reference to an int as an argument // and return pointers to // an array of 5 floats.

        发表于 @ 2006年03月30日 12:01 AM | 评论 (0)

        看一个标准的库函数是怎么写的

        char * strcpy( char *strDest, const char *strSrc )

        { assert( )strDest != NULL( && )strSrc != NULL( );char *address = strDest;while( )*strDest++ = * strSrc++( != ‘/0’ )

        ;return address;{注意的地方:1,const char *strSrc  因为strSrc是输入参数,不能被修改。

        2,assert的使用。头文件加上include<assert.h>.对源地址和目的地址加非0断言,加强程序的健壮性。如果strDest 或者strSrc为空指针,那么系统会提示:Assertion failed,并指出出错位置。

        3,用了一个变量address.是为了实现链式操作,将目的地址返回。比如strcpy( s,strcpy)t,a( );把a的内容复制给t,再把t的内容复制给s. 4,while( )*strDest++ = * strSrc++( != ‘/0’ )。根据优先级,先把strSrc所指内存的值赋值到strDest所指的内存中,然后strSrc指向下一块内存,strDest也一样。直到遇到'/0'为止。此时,*strDest和*strSrc的值都为'/0'.

        我自己写了一个程序,用来验证这个函数。但却犯了一个错误。后来看了一下自己以前的笔记才发现错误的原因。贴出来,看你能看到错误在哪里吗?

        #include<stdio.h> #include<assert.h>

        char *strcopy(char *strDest, const char *strSrc);

        main()

        { char *s = "moonbingbing";char *t = "wenming";

        strcopy(s,t);printf("%s/n%s/n",s,t);return 0;{

        char *strcopy(char *strDest, const char *strSrc)

        { assert( )strDest != NULL( && )strSrc != NULL( );char *address = strDest;while( )*strDest++ = * strSrc++( != '/0' )

        ;return address;{

        错就错在char *s = "moonbingbing";char *t = "wenming";因为在ANSI C中,指针p 指向的字符串是当作常量来处理的。如果你的编译器是tc2.0 ,tc++3.0 ,wintc,那么编译器不会报错。从这个程序可以看出,写一个程序不难,但写好就容易了。这些库函数都是高手们写的,要考虑健壮性,安全性,扩展性。这就是高手和和一般人的区别了。

        这些东西在林锐的书上见过,有一段时间没温习c语言了。看一遍就有一些新的收获,温故而知新啊。所以记下来,别再忘了。

        发表于 @ 2006年03月29日 11:53 PM | 评论 (0)

        探讨scanf函数

        scanf函数我曾经在这个函数上犯过不少错误,也看到别人犯过的错误,记下来,提醒自己不要重蹈覆辙了。如果对你有用,那就更好了:(如果你发现文章中有错误,欢迎你不吝赐教。希望和大家一起学习。

        有关详细的scanf函数解释,大家可以去看看《C程序设计语言》(K&C)和《C语言大全》(后面我把其中scanf的部分贴了出来)。

        曾经错的几个地方:(xpsp2,vc6.0环境下)

        1.空白符问题#include<stdio.h> main()

        { int a;printf("input the data/n");scanf("%d/n",&a);//这里多了一个回车符/n printf("%d",a);return 0;}结果要输入两个数程序才结束,而不是预期的一个。why?

        原因:用空白符结尾时,scanf会跳过空白符去读下一个字符,所以你必须再输入一个数。这里的空白符包括空格,制表符,换行符,回车符和换页符。所以如果你用scanf("%d  ",&a)也会出现同样的问题。

        解决方法:这种错误大多是输入的时候不小心,多注意一点就好了。这种问题也不好检查,编译没有问题,一个空格也不容易看出来。当你的程序出现上面的问题时,自己对照检查一下就可以了。

        2.缓冲区问题这是一个非常容易错的地方,我就错过多次。

        #include <stdio.h> main()

        { int n = 5;char c[n];for(int i = 0; i < n; i++)

        c[i] = scanf("%c",&c[i]);printf(c);return 0;{如果输入:a b c那么循环就会“提前”结束了。

        原因:输入a和第一个回车后,a和这个回车符都留在缓冲区中。第一个scanf读取了a,但是输入缓冲区里面还留有一个/n,第二个scanf读取这个/n.然后输入b和第二个回车,同样的,第三个scanf读取了b,第四个scanf读取了第二个回车符。第五个读取了c.所以五个scanf都执行了,并没有提前结束。只不过有的scanf读取到了回车符而已。

        解决方法:把程序改成这样就可以了:for( i = 0; i < n; i++){ scanf("%c",&c[i]);fflush(stdin);//刷新缓冲区}或者不用scanf,而用gets()函数,如:#include<stdio.h> main()

        { char c[5];gets(c);printf(c);return 0;}但要注意:这个函数自动把你最后敲的回车转换为字符'/0'.如果你的输入超过了数组的大小,那么就会产生错误。

        3.scanf()函数的参数输入类型不匹配问题这是我在csdn论坛上见到的问题,这个错误有时候会让人莫名其妙。

        #include<stdio.h> main()

        { int a=123;char c='t';printf("input/n");scanf("%d%c",&a,&c);printf("%d/n%c/n",a,c);return 0;}当输入a 回车 后,会直接跳过下面2个scanf语句,直接输出为123 t原因:对于scanf("%d%c",&a,&c),scanf语句执行时,首先试图从缓冲区中读入一个%d类型的数据,如果和第一个参数匹配,则继续从缓冲区中读取数据和第二个参数进行匹配,依次进行下去,直到匹配完所有的参数;如果其中有一个参数不匹配,那就从这个地方跳出,忽略这个scanf后面所有的参数,而去执行下一条语句。

        可以用下面的程序验证一下:#include <stdio.h> int main()

        { int a=123,b=1;char c='t';scanf("%d%d",&a,&b);scanf("%c",&c);printf("%d/n%d/n%c/n",a,b,c);return 0;}输入:2 回车a 回车结果是:2 1 a解决方法:scanf()函数执行成功时的返回值是成功读取的变量数,也就是说,你这个scanf()函数有几个变量,如果scanf()函数全部正常读取,它就返回几。但这里还要注意另一个问题,如果输入了非法数据,键盘缓冲区就可能还个有残余信息问题。

        比如:#include <stdio.h> main()

        { int a=123,b;while(scanf)"%d%d",&a,&b(!=2)

        fflush(stdin);printf("%d/n%d/n",a,b);return 0;{你可以试一下,如果输入不是数字时,会有什么反应。

        补充:scanf中一种很少见但很有用的转换字符:[……]和[ ^……]. #include<stdio.h> main()

        { char strings[100];scanf("%[1234567890]",strings);printf("%s",strings);return  0;}运行,输入:1234werew后,结果是:1234.通过运行可以发现它的作用是:如果输入的字符属于方括号内字符串中某个字符,那么就提取该字符;如果一经发现不属于就结束提取。该方法会自动加上一个字符串结束符到已经提取的字符后面。

        scanf("%[^1234567890]",strings); 它的作用是:如果一经发现输入的字符属于方括号内字符串中某个字符,那么就结束提取;如果不属于就提取该字符。该方法会自动加上一个字符串结束符到已经提取的字符后面。

        注意:方括号两边不能空格,如:scanf("%[ 1234567890 ]",strings); scanf("%[ ^1234567890 ]",strings); 不让空格也会算在里面的。

        用这种方法还可以解决scanf的输入中不能有空格的问题。只要用scanf("%[^/n]",strings); 就可以了。很神奇吧。

        scanf原型:参见《C语言大全》和K&C # include <stdio.h>;int scanf( const char *format, …… );函数 scanf() 是从标准输入流 stdin 中读内容的通用子程序,可以读入全部固有类型的数据并自动转换成机内形式。

        在 C99 中,format 用 restrict 修饰。

        format 指向的控制串由以下三类字符组成:● 格式说明符● 空白符● 非空白符

        转换字符(就是%后跟的部分)

        a   读浮点值(仅适用于 C99)

        A   读浮点值(仅适用于 C99)

        c   读单字符d   读十进制整数i   读十进制、八进制、十六进制整数e   读浮点数E   读浮点数f   读浮点数F   读浮点数(仅适用于 C99)

        g   读浮点数G   读浮点数o   读八进制数s   读字符串x   读十六进制数X   读十六进制数p   读指针值n   至此已读入值的等价字符数u   读无符号十进制整数[ ]  扫描字符集合%   读 % 符号(百分号)

        例如: %s 表示读串而 %d 表示读整数。格式串的处理顺序为从左到右,格式说明符逐一与变元表中的变元匹配。为了读取长整数,可以将 l(ell) 放在格式说明符的前面;为了读取短整数,可以将 h 放在格式说明符的前面。这些修饰符可以与 d、i、o、u 和 x 格式代码一起使用。

        默认情况下,a、f、e 和 g 告诉 scanf() 为 float 分配数据。 如果将 l(ell) 放在这些修饰符的前面,则 scanf() 为 double 分配数据。使用 L 就是告诉 scanf(),接收数据的变量是 long double 型变量。

        如果使用的现代编译器程序支持 1995 年增加的宽字符特性, 则可以与 c 格式代码一起,用 l 修饰符说明类型 wchar_t 的宽字符指针;也可以与 s 格式代码一起,用 l 修饰符说明宽字符串的指针。l 修饰符也可以用于修饰扫描集,以说明宽字符。

        控制串中的空白符使 scanf() 在输入流中跳过一个或多个空白行。空白符可以是空格(space)、制表符(tab)和新行符(newline)。 本质上,控制串中的空白符使 scanf() 在输入流中读,但不保存结果,直到发现非空白字符为止。

        非空白符使 scanf() 在流中读一个匹配的字符并忽略之。例如,"%d,%d" 使 scanf() 先读入一个整数,读入中放弃逗号,然后读另一个整数。如未发现匹配,scanf() 返回。

        scanf() 中用于保存读入值的变元必须都是变量指针,即相应变量的地址。

        在输入流中,数据项必须由空格、制表符和新行符分割。逗号和分号等不是分隔符,比如以下代码:scanf( "%d %d", &r, &c );将接受输入 10 20,但遇到 10,20 则失败。

        百分号(%)与格式符之间的星号(*)表示读指定类型的数据但不保存。因此,scanf( "%d %*c %d", &x, &y );对 10/20 的读入操作中,10 放入变量 x,20 放入 y.

        格式命令可以说明最大域宽。 在百分号(%)与格式码之间的整数用于限制从对应域读入的最大字符数。例如,希望向 address 读入不多于 20 个字符时,可以书写成如下形式:scanf( "%20s", address );

        如果输入流的内容多于 20 个字符,则下次 scanf() 从此次停止处开始读入。 若达到最大域宽前已遇到空白符,则对该域的读立即停止;此时,scanf() 跳到下一个域。

        虽然空格、制表符和新行符都用做域分割符号,但读单字符操作中却按一般字符处理。例如,对输入流 "x y" 调用:scanf( "%c%c%c", &a, &b, &c );返回后,x 在变量 a 中,空格在变量 b 中,y 在变量 c 中。

        注意,控制串中的其它字符,包括空格、制表符和新行符,都用于从输入流中匹配并放弃字符,被匹配的字符都放弃。例如,给定输入流 "10t20",调用:scanf( "%dt%d", &x, &y );将把 10 和 20 分别放到 x 和 y 中,t 被放弃,因为 t 在控制串中。

        ANSI C 标准向 scanf() 增加了一种新特性,称为扫描集(scanset)。 扫描集定义一个字符集合,可由 scanf() 读入其中允许的字符并赋给对应字符数组。 扫描集合由一对方括号中的一串字符定义,左方括号前必须缀以百分号。 例如,以下的扫描集使 scanf() 读入字符 A、B 和 C:%[ABC]

        使用扫描集时,scanf() 连续吃进集合中的字符并放入对应的字符数组,直到发现不在集合中的字符为止(即扫描集仅读匹配的字符)。返回时,数组中放置以 null 结尾、由读入字符组成的字符串。

        用字符 ^ 可以说明补集。把 ^ 字符放为扫描集的第一字符时,构成其它字符组成的命令的补集合,指示 scanf() 只接受未说明的其它字符。

        对于许多实现来说,用连字符可以说明一个范围。 例如,以下扫描集使 scanf() 接受字母 A 到 Z:%[A-Z]重要的是要注意扫描集是区分大小写的。因此,希望扫描大、小写字符时,应该分别说明大、小写字母。

        scanf() 返回等于成功赋值的域数的值,但由于星号修饰符而读入未赋值的域不计算在内。给第一个域赋值前已出错时,返回 EOF.

        C99 为 scanf() 增加了几个格式修饰符:hh、ll、j、z 和 t.hh 修饰符可用于 d、i、o、u、x、X 或 n.它说明相应的变元是 signed 或 unsigned char 值,或用于 n 时, 相应的变元是指向 long char 型变量的指针。ll 修饰符也可用于 d、i、o、u、x、X 或 n.它说明相应的变元是 signed 或者 unsigned long long int 值。

        j 格式修饰符应用于 d、i、o、u、x、X 或 n,说明匹配的变元是类型 intmax_t 或 uintmax_t.这些类型在 <stdint.h>; 中声明,并说明最大宽度的整数。

        z 格式修饰符应用于 d、i、o、u、x、X 或 n,说明匹配的变元是指向 size_t 类型对象的指针。该类型在 <stddef.h>; 中声明,并说明 sizeof 的结构。

        t 格式修饰符应用于 d、i、o、u、x、X 或 n,说明匹配的变元是指向 ptrdiff_t  类型对象的指针。该类型在 <stddef.h>; 中声明,并说明两个指针之间的差别。

        例子:

        # include <stdio.h>;int main( void )

        { char str[80], str2[80];int i;/* read a string and a integer */ scanf( "%s%d", str, &i );/* read up to 79 chars into str */ scanf( "%79s", str );/* skip the integer between the two strings */ scanf( "%s%*d%s", str, str2 );return 0;}

        发表于 @ 2006年03月29日 11:49 PM | 评论 (0)

        Turbo C 2.0 函数中文说明大全

        分类函数,所在函数库为ctype.h int isalpha(int ch) 若ch是字母('A'-'Z','a'-'z')返回非0值,否则返回0 int isalnum(int ch) 若ch是字母('A'-'Z','a'-'z')或数字('0'-'9'),返回非0值,否则返回0 int isascii(int ch) 若ch是字符(ASCII码中的0-127)返回非0值,否则返回0 int iscntrl(int ch) 若ch是作废字符(0x7F)或普通控制字符(0x00-0x1F),返回非0值,否则返回0 int isdigit(int ch) 若ch是数字('0'-'9')返回非0值,否则返回0 int isgraph(int ch) 若ch是可打印字符(不含空格)(0x21-0x7E)返回非0值,否则返回0 int islower(int ch) 若ch是小写字母('a'-'z')返回非0值,否则返回0 int isprint(int ch) 若ch是可打印字符(含空格)(0x20-0x7E)返回非0值,否则返回0 int ispunct(int ch) 若ch是标点字符(0x00-0x1F)返回非0值,否则返回0 int isspace(int ch) 若ch是空格(' '),水平制表符('/t'),回车符('/r'), 走纸换行('/f'),垂直制表符('/v'),换行符('/n'), 返回非0值,否则返回0 int isupper(int ch) 若ch是大写字母('A'-'Z')返回非0值,否则返回0 int isxdigit(int ch) 若ch是16进制数('0'-'9','A'-'F','a'-'f')返回非0值, 否则返回0 int tolower(int ch) 若ch是大写字母('A'-'Z')返回相应的小写字母('a'-'z')

        int toupper(int ch) 若ch是小写字母('a'-'z')返回相应的大写字母('A'-'Z')

        数学函数,所在函数库为math.h、stdlib.h、string.h、float.h int abs(int i) 返回整型参数i的绝对值double cabs(struct complex znum) 返回复数znum的绝对值double fabs(double x) 返回双精度参数x的绝对值long labs(long n) 返回长整型参数n的绝对值double exp(double x) 返回指数函数ex的值double frexp(double value,int *eptr) 返回value=x*2n中x的值,n存贮在eptr中double ldexp(double value,int exp); 返回value*2exp的值double log(double x) 返回logex的值double log10(double x) 返回log10x的值double pow(double x,double y) 返回xy的值double pow10(int p) 返回10p的值double sqrt(double x) 返回x的开方double acos(double x) 返回x的反余弦cos-1(x)值,x为弧度double asin(double x) 返回x的反正弦sin-1(x)值,x为弧度double atan(double x) 返回x的反正切tan-1(x)值,x为弧度double atan2(double y,double x) 返回y/x的反正切tan-1(x)值,y的x为弧度double cos(double x) 返回x的余弦cos(x)值,x为弧度double sin(double x) 返回x的正弦sin(x)值,x为弧度double tan(double x) 返回x的正切tan(x)值,x为弧度double cosh(double x) 返回x的双曲余弦cosh(x)值,x为弧度double sinh(double x) 返回x的双曲正弦sinh(x)值,x为弧度double tanh(double x) 返回x的双曲正切tanh(x)值,x为弧度double hypot(double x,double y) 返回直角三角形斜边的长度(z), x和y为直角边的长度,z2=x2+y2 double ceil(double x) 返回不小于x的最小整数double floor(double x) 返回不大于x的最大整数void srand(unsigned seed) 初始化随机数发生器int rand() 产生一个随机数并返回这个数double poly(double x,int n,double c[]) 从参数产生一个多项式double modf(double value,double *iptr) 将双精度数value分解成尾数和阶double fmod(double x,double y) 返回x/y的余数double frexp(double value,int *eptr) 将双精度数value分成尾数和阶double atof(char *nptr) 将字符串nptr转换成浮点数并返回这个浮点数double atoi(char *nptr) 将字符串nptr转换成整数并返回这个整数double atol(char *nptr) 将字符串nptr转换成长整数并返回这个整数char *ecvt(double value,int ndigit,int *decpt,int *sign)

        将浮点数value转换成字符串并返回该字符串char *fcvt(double value,int ndigit,int *decpt,int *sign)

        将浮点数value转换成字符串并返回该字符串char *gcvt(double value,int ndigit,char *buf)

        将数value转换成字符串并存于buf中,并返回buf的指针char *ultoa(unsigned long value,char *string,int radix)

        将无符号整型数value转换成字符串并返回该字符串,radix为转换时所用基数char *ltoa(long value,char *string,int radix)

        将长整型数value转换成字符串并返回该字符串,radix为转换时所用基数char *itoa(int value,char *string,int radix)

        将整数value转换成字符串存入string,radix为转换时所用基数double atof(char *nptr) 将字符串nptr转换成双精度数,并返回这个数,错误返回0 int atoi(char *nptr) 将字符串nptr转换成整型数, 并返回这个数,错误返回0 long atol(char *nptr) 将字符串nptr转换成长整型数,并返回这个数,错误返回0 double strtod(char *str,char **endptr)将字符串str转换成双精度数,并返回这个数,long strtol(char *str,char **endptr,int base)将字符串str转换成长整型数, 并返回这个数,int matherr(struct exception *e) 用户修改数学错误返回信息函数(没有必要使用)

        double _matherr(_mexcep why,char *fun,double *arg1p, double *arg2p,double retval)

        用户修改数学错误返回信息函数(没有必要使用)

        unsigned int _clear87() 清除浮点状态字并返回原来的浮点状态void _fpreset() 重新初使化浮点数学程序包unsigned int _status87() 返回浮点状态字

        目录函数,所在函数库为dir.h、dos.h int chdir(char *path) 使指定的目录path(如:"C://WPS")变成当前的工作目录,成功返回0 int findfirst(char *pathname,struct ffblk *ffblk,int attrib)

        查找指定的文件,成功返回0 pathname为指定的目录名和文件名,如"C://WPS//TXT" ffblk为指定的保存文件信息的一个结构,定义如下:┏━━━━━━━━━━━━━━━━━━┓┃struct ffblk ┃┃{ ┃┃ char ff_reserved[21]; /*DOS保留字*/┃┃ char ff_attrib; /*文件属性*/ ┃┃ int ff_ftime; /*文件时间*/ ┃┃ int ff_fdate; /*文件日期*/ ┃┃ long ff_fsize; /*文件长度*/ ┃┃ char ff_name[13]; /*文件名*/ ┃┃} ┃┗━━━━━━━━━━━━━━━━━━┛attrib为文件属性,由以下字符代表┏━━━━━━━━━┳━━━━━━━━┓┃FA_RDONLY 只读文件┃FA_LABEL 卷标号┃┃FA_HIDDEN 隐藏文件┃FA_DIREC 目录 ┃┃FA_SYSTEM 系统文件┃FA_ARCH 档案 ┃┗━━━━━━━━━┻━━━━━━━━┛例:struct ffblk ff;findfirst("*.wps",&ff,FA_RDONLY);

        int findnext(struct ffblk *ffblk) 取匹配finddirst的文件,成功返回0 void fumerge(char *path,char *drive,char *dir,char *name,char *ext)

        此函数通过盘符drive(C:、A:等), 路径dir(/TC、/BC/LIB等), 文件名name(TC、WPS等),扩展名ext(。EXE、。COM等)组成一个文件名存与path中。

        int fnsplit(char *path,char *drive,char *dir,char *name,char *ext)

        此函数将文件名path分解成盘符drive(C:、A:等), 路径dir(/TC、/BC/LIB等), 文件名name(TC、WPS等),扩展名ext(。EXE、。COM等),并分别存入相应的变量中。

        int getcurdir(int drive,char *direc)

        此函数返回指定驱动器的当前工作目录名称。成功返回0 drive 指定的驱动器(0=当前,1=A,2=B,3=C等)

        direc 保存指定驱动器当前工作路径的变量char *getcwd(char *buf,iint n) 此函数取当前工作目录并存入buf中,直到n个字节长为为止。错误返回NULL int getdisk() 取当前正在使用的驱动器,返回一个整数(0=A,1=B,2=C等)

        int setdisk(int drive) 设置要使用的驱动器drive(0=A,1=B,2=C等), 返回可使用驱动器总数int mkdir(char *pathname) 建立一个新的目录pathname,成功返回0 int rmdir(char *pathname) 删除一个目录pathname,成功返回0 char *mktemp(char *template) 构造一个当前目录上没有的文件名并存于template中char *searchpath(char *pathname) 利用MSDOS找出文件filename所在路径, 此函数使用DOS的PATH变量,未找到文件返回NULL

        进程函数,所在函数库为stdlib.h、process.h void abort() 此函数通过调用具有出口代码3的_exit写一个终止信息于stderr,并异常终止程序。无返回值

        int exec…装入和运行其它程序int execl(char *pathname,char *arg0,char *arg1,…,char *argn,NULL)

        int execle(char *pathname,char *arg0,char *arg1,…, char *argn,NULL,char *envp[])

        int execlp(char *pathname,char *arg0,char *arg1,…,NULL)

        int execlpe(char *pathname,char *arg0,char *arg1,…,NULL,char *envp[])

        int execv(char *pathname,char *argv[])

        int execve(char *pathname,char *argv[],char *envp[])

        int execvp(char *pathname,char *argv[])

        int execvpe(char *pathname,char *argv[],char *envp[])

        exec函数族装入并运行程序pathname,并将参数arg0(arg1,arg2,argv[],envp[])传递给子程序,出错返回-1.在exec函数族中,后缀l、v、p、e添加到exec后,所指定的函数将具有某种操作能力。

        有后缀 p时,函数可以利用DOS的PATH变量查找子程序文件。

        l时,函数中被传递的参数个数固定。

        v时,函数中被传递的参数个数不固定。

        e时,函数传递指定参数envp,允许改变子进程的环境,无后缀 e时,子进程使用当前程序的环境。

        void _exit(int status) 终止当前程序,但不清理现场void exit(int status) 终止当前程序,关闭所有文件,写缓冲区的输出(等待输出), 并调用任何寄存器的"出口函数",无返回值

        int spawn…运行子程序int spawnl(int mode,char *pathname,char *arg0,char *arg1,…, char *argn,NULL)

        int spawnle(int mode,char *pathname,char *arg0,char *arg1,…, char *argn,NULL,char *envp[])

        int spawnlp(int mode,char *pathname,char *arg0,char *arg1,…, char *argn,NULL)

        int spawnlpe(int mode,char *pathname,char *arg0,char *arg1,…, char *argn,NULL,char *envp[])

        int spawnv(int mode,char *pathname,char *argv[])

        int spawnve(int mode,char *pathname,char *argv[],char *envp[])

        int spawnvp(int mode,char *pathname,char *argv[])

        int spawnvpe(int mode,char *pathname,char *argv[],char *envp[])

        spawn函数族在mode模式下运行子程序pathname,并将参数arg0(arg1,arg2,argv[],envp[])传递给子程序。出错返回-1 mode为运行模式:mode为 P_WAIT 表示在子程序运行完后返回本程序P_NOWAIT 表示在子程序运行时同时运行本程序(不可用)

        P_OVERLAY 表示在本程序退出后运行子程序

        在spawn函数族中,后缀l、v、p、e添加到spawn后,所指定的函数将具有某种操作能力有后缀 p时, 函数利用DOS的PATH查找子程序文件l时, 函数传递的参数个数固定。

        v时, 函数传递的参数个数不固定。

        e时, 指定参数envp可以传递给子程序,允许改变子程序运行环境。

        无后缀 e时,子程序使用本程序的环境。

        int system(char *command)

        将MSDOS命令command传递给DOS执行转换子程序,函数库为math.h、stdlib.h、ctype.h、float.h char *ecvt(double value,int ndigit,int *decpt,int *sign)

        将浮点数value转换成字符串并返回该字符串char *fcvt(double value,int ndigit,int *decpt,int *sign)

        将浮点数value转换成字符串并返回该字符串char *gcvt(double value,int ndigit,char *buf)

        将数value转换成字符串并存于buf中,并返回buf的指针char *ultoa(unsigned long value,char *string,int radix)

        将无符号整型数value转换成字符串并返回该字符串,radix为转换时所用基数char *ltoa(long value,char *string,int radix)

        将长整型数value转换成字符串并返回该字符串,radix为转换时所用基数char *itoa(int value,char *string,int radix)

        将整数value转换成字符串存入string,radix为转换时所用基数double atof(char *nptr) 将字符串nptr转换成双精度数,并返回这个数,错误返回0 int atoi(char *nptr) 将字符串nptr转换成整型数, 并返回这个数,错误返回0 long atol(char *nptr) 将字符串nptr转换成长整型数,并返回这个数,错误返回0 double strtod(char *str,char **endptr)

        将字符串str转换成双精度数,并返回这个数,long strtol(char *str,char **endptr,int base)

        将字符串str转换成长整型数, 并返回这个数,int toascii(int c) 返回c相应的ASCII int tolower(int ch) 若ch是大写字母('A'-'Z')返回相应的小写字母('a'- 'z')

        int _tolower(int ch) 返回ch相应的小写字母('a'-'z')

        int toupper(int ch) 若ch是小写字母('a'-'z')返回相应的大写字母('A'- 'Z')

        int _toupper(int ch) 返回ch相应的大写字母('A'-'Z')

        诊断函数,所在函数库为assert.h、math.h void assert(int test) 一个扩展成if语句那样的宏,如果test测试失败,就显示一个信息并异常终止程序,无返回值void perror(char *string) 本函数将显示最近一次的错误信息,格式如:字符串string:错误信息char *strerror(char *str) 本函数返回最近一次的错误信息,格式如: 字符串str:错误信息int matherr(struct exception *e)

        用户修改数学错误返回信息函数(没有必要使用)

        double _matherr(_mexcep why,char *fun,double *arg1p, double *arg2p,double retval)

        用户修改数学错误返回信息函数(没有必要使用)

        输入输出子程序, 函数库为io.h、conio.h、stat.h、dos.h、stdio.h、signal.h

        int kbhit() 本函数返回最近所敲的按键int fgetchar() 从控制台(键盘)读一个字符,显示在屏幕上int getch() 从控制台(键盘)读一个字符,不显示在屏幕上int putch() 向控制台(键盘)写一个字符int getchar() 从控制台(键盘)读一个字符,显示在屏幕上int putchar() 向控制台(键盘)写一个字符int getche() 从控制台(键盘)读一个字符,显示在屏幕上int ungetch(int c) 把字符c退回给控制台(键盘)

        char *cgets(char *string) 从控制台(键盘)读入字符串存于string中int scanf(char *format[,argument…])

        从控制台读入一个字符串,分别对各个参数进行赋值,使用BIOS进行输出int vscanf(char *format,Valist param)

        从控制台读入一个字符串,分别对各个参数进行赋值,使用BIOS进行输出,参数从Valist param中取得int cscanf(char *format[,argument…])

        从控制台读入一个字符串,分别对各个参数进行赋值,直接对控制台作操作,比如显示器在显示时字符时即为直接写频方式显示int sscanf(char *string,char *format[,argument,…])

        通过字符串string, 分别对各个参数进行赋值int vsscanf(char *string,char *format,Vlist param)

        通过字符串string,分别对各个参数进行赋值,参数从Vlist param中取得int puts(char *string) 发关一个字符串string给控制台(显示器), 使用BIOS进行输出void cputs(char *string) 发送一个字符串string给控制台(显示器), 直接对控制台作操作,比如显示器即为直接写频方式显示int printf(char *format[,argument,…])

        发送格式化字符串输出给控制台(显示器),使用BIOS进行输出int vprintf(char *format,Valist param)

        发送格式化字符串输出给控制台(显示器),使用BIOS进行输出,参数从Valist param中取得int cprintf(char *format[,argument,…])

        发送格式化字符串输出给控制台(显示器), 直接对控制台作操作,比如显示器即为直接写频方式显示int vcprintf(char *format,Valist param)

        发送格式化字符串输出给控制台(显示器), 直接对控制台作操作,比如显示器即为直接写频方式显示, 参数从Valist param中取得int sprintf(char *string,char *format[,argument,…])

        将字符串string的内容重新写为格式化后的字符串int vsprintf(char *string,char *format,Valist param)

        将字符串string的内容重新写为格式化后的字符串,参数从Valist param中取得int rename(char *oldname,char *newname)将文件oldname的名称改为newname int ioctl(int handle,int cmd[,int *argdx,int argcx])

        本函数是用来控制输入/输出设备的,请见下表:┌───┬────────────────────────────┐│cmd值 │功能 │├───┼────────────────────────────┤│ 0 │取出设备信息 ││ 1 │设置设备信息 ││ 2 │把argcx字节读入由argdx所指的地址 ││ 3 │在argdx所指的地址写argcx字节 ││ 4 │除把handle当作设备号(0=当前,1=A,等)之外,均和cmd=2时一样 ││ 5 │除把handle当作设备号(0=当前,1=A,等)之外,均和cmd=3时一样 ││ 6 │取输入状态 ││ 7 │取输出状态 ││ 8 │测试可换性;只对于DOS 3.x ││ 11 │置分享冲突的重算计数;只对DOS 3.x │└───┴────────────────────────────┘int (*ssignal)int sig,int(*action)()()( 执行软件信号)没必要使用(

        int gsignal(int sig) 执行软件信号(没必要使用)

        int _open(char *pathname,int access)为读或写打开一个文件, 按后按access来确定是读文件还是写文件,access值见下表┌──────┬────────────────────┐│access值 │意义 │├──────┼────────────────────┤│O_RDONLY │读文件 ││O_WRONLY │写文件 ││O_RDWR │即读也写 ││O_NOINHERIT │若文件没有传递给子程序,则被包含 ││O_DENYALL │只允许当前处理必须存取的文件 ││O_DENYWRITE │只允许从任何其它打开的文件读 ││O_DENYREAD │只允许从任何其它打开的文件写 ││O_DENYNONE │允许其它共享打开的文件 │└──────┴────────────────────┘int open(char *pathname,int access[,int permiss])为读或写打开一个文件, 按后按access来确定是读文件还是写文件,access值见下表┌────┬────────────────────┐│access值│意义 │├────┼────────────────────┤│O_RDONLY│读文件 ││O_WRONLY│写文件 ││O_RDWR │即读也写 ││O_NDELAY│没有使用;对UNIX系统兼容 ││O_APPEND│即读也写,但每次写总是在文件尾添加 ││O_CREAT │若文件存在,此标志无用;若不存在,建新文件 ││O_TRUNC │若文件存在,则长度被截为0,属性不变 ││O_EXCL │未用;对UNIX系统兼容 ││O_BINARY│此标志可显示地给出以二进制方式打开文件 ││O_TEXT │此标志可用于显示地给出以文本方式打开文件│└────┴────────────────────┘permiss为文件属性,可为以下值:S_IWRITE允许写 S_IREAD允许读 S_IREAD|S_IWRITE允许读、写int creat(char *filename,int permiss) 建立一个新文件filename,并设定读写性。

        permiss为文件读写性,可以为以下值S_IWRITE允许写 S_IREAD允许读 S_IREAD|S_IWRITE允许读、写int _creat(char *filename,int attrib) 建立一个新文件filename,并设定文件属性。

        attrib为文件属性,可以为以下值FA_RDONLY只读 FA_HIDDEN隐藏 FA_SYSTEM系统int creatnew(char *filenamt,int attrib) 建立一个新文件filename,并设定文件属性。

        attrib为文件属性,可以为以下值FA_RDONLY只读 FA_HIDDEN隐藏 FA_SYSTEM系统int creattemp(char *filenamt,int attrib) 建立一个新文件filename,并设定文件属性。

        attrib为文件属性,可以为以下值FA_RDONLY只读 FA_HIDDEN隐藏 FA_SYSTEM系统int read(int handle,void *buf,int nbyte) 从文件号为handle的文件中读nbyte个字符存入buf中int _read(int handle,void *buf,int nbyte) 从文件号为handle的文件中读nbyte个字符存入buf中,直接调用MSDOS进行操作。

        int write(int handle,void *buf,int nbyte) 将buf中的nbyte个字符写入文件号为handle的文件中int _write(int handle,void *buf,int nbyte) 将buf中的nbyte个字符写入文件号为handle的文件中int dup(int handle) 复制一个文件处理指针handle,返回这个指针int dup2(int handle,int newhandle) 复制一个文件处理指针handle到newhandle int eof(int *handle) 检查文件是否结束,结束返回1,否则返回0 long filelength(int handle) 返回文件长度,handle为文件号int setmode(int handle,unsigned mode)本函数用来设定文件号为handle的文件的打开方式int getftime(int handle,struct ftime *ftime)

        读取文件号为handle的文件的时间,并将文件时间存于ftime结构中,成功返回0, ftime结构如下:┌─────────────────┐│struct ftime ││{ ││ unsigned ft_tsec:5; /*秒*/ ││ unsigned ft_min:6; /*分*/ ││ unsigned ft_hour:5; /*时*/ ││ unsigned ft_day:5; /*日*/ ││ unsigned ft_month:4;/*月*/ ││ unsigned ft_year:1; /*年-1980*/ ││} │└─────────────────┘int setftime(int handle,struct ftime *ftime) 重写文件号为handle的文件时间,新时间在结构ftime中。成功返回0.结构ftime如下:┌─────────────────┐│struct ftime ││{ ││ unsigned ft_tsec:5; /*秒*/ ││ unsigned ft_min:6; /*分*/ ││ unsigned ft_hour:5; /*时*/ ││ unsigned ft_day:5; /*日*/ ││ unsigned ft_month:4;/*月*/ ││ unsigned ft_year:1; /*年-1980*/ ││} │└─────────────────┘long lseek(int handle,long offset,int fromwhere)

        本函数将文件号为handle的文件的指针移到fromwhere后的第offset个字节处。

        SEEK_SET文件开关 SEEK_CUR当前位置 SEEK_END文件尾long tell(int handle) 本函数返回文件号为handle的文件指针,以字节表示int isatty(int handle)本函数用来取设备handle的类型int lock(int handle,long offset,long length) 对文件共享作封锁int unlock(int handle,long offset,long length) 打开对文件共享的封锁

        int close(int handle) 关闭handle所表示的文件处理,handle是从_creat、creat、creatnew、creattemp、dup、dup2、_open、open中的一个处调用获得的文件处理成功返回0否则返回-1,可用于UNIX系统int _close(int handle) 关闭handle所表示的文件处理,handle是从_creat、creat、creatnew、creattemp、dup、dup2、_open、open中的一个处调用获得的文件处理成功返回0否则返回-1,只能用于MSDOS系统

        FILE *fopen(char *filename,char *type) 打开一个文件filename,打开方式为type,并返回这个文件指针,type可为以下字符串加上后缀┌──┬────┬───────┬────────┐│type│读写性 │文本/2进制文件│建新/打开旧文件 │├──┼────┼───────┼────────┤│r │读 │文本 │打开旧的文件 ││w │写 │文本 │建新文件 ││a │添加 │文本 │有就打开无则建新││r+ │读/写 │不限制 │打开 ││w+ │读/写 │不限制 │建新文件 ││a+ │读/添加 │不限制 │有就打开无则建新│└──┴────┴───────┴────────┘可加的后缀为t、b.加b表示文件以二进制形式进行操作,t没必要使用例: ┌──────────────────┐│#include<stdio.h> ││main() ││{ ││ FILE *fp; ││ fp=fopen("C://WPS//WPS.EXE","r+b");│└──────────────────┘FILE *fdopen(int ahndle,char *type)

        FILE *freopen(char *filename,char *type,FILE *stream)

        int getc(FILE *stream) 从流stream中读一个字符,并返回这个字符int putc(int ch,FILE *stream) 向流stream写入一个字符ch int getw(FILE *stream) 从流stream读入一个整数,错误返回EOF int putw(int w,FILE *stream) 向流stream写入一个整数int ungetc(char c,FILE *stream) 把字符c退回给流stream,下一次读进的字符将是c int fgetc(FILE *stream) 从流stream处读一个字符,并返回这个字符int fputc(int ch,FILE *stream) 将字符ch写入流stream中char *fgets(char *string,int n,FILE *stream)

        从流stream中读n个字符存入string中int fputs(char *string,FILE *stream)将字符串string写入流stream中int fread(void *ptr,int size,int nitems,FILE *stream)

        从流stream中读入nitems个长度为size的字符串存入ptr中int fwrite(void *ptr,int size,int nitems,FILE *stream)

        向流stream中写入nitems个长度为size的字符串,字符串在ptr中int fscanf(FILE *stream,char *format[,argument,…])

        以格式化形式从流stream中读入一个字符串int vfscanf(FILE *stream,char *format,Valist param)

        以格式化形式从流stream中读入一个字符串,参数从Valist param中取得int fprintf(FILE *stream,char *format[,argument,…])

        以格式化形式将一个字符串写给指定的流stream int vfprintf(FILE *stream,char *format,Valist param)

        以格式化形式将一个字符串写给指定的流stream,参数从Valist param中取得int fseek(FILE *stream,long offset,int fromwhere)

        函数把文件指针移到fromwhere所指位置的向后offset个字节处,fromwhere可以为以下值:SEEK_SET 文件开关 SEEK_CUR 当前位置 SEEK_END 文件尾long ftell(FILE *stream) 函数返回定位在stream中的当前文件指针位置,以字节表示int rewind(FILE *stream) 将当前文件指针stream移到文件开头int feof(FILE *stream) 检测流stream上的文件指针是否在结束位置int fileno(FILE *stream) 取流stream上的文件处理,并返回文件处理int ferror(FILE *stream) 检测流stream上是否有读写错误,如有错误就返回1 void clearerr(FILE *stream) 清除流stream上的读写错误void setbuf(FILE *stream,char *buf) 给流stream指定一个缓冲区buf void setvbuf(FILE *stream,char *buf,int type,unsigned size)

        给流stream指定一个缓冲区buf,大小为size,类型为type,type的值见下表

        ┌───┬───────────────────────────────┐│type值│意义 │├───┼───────────────────────────────┤│_IOFBF│文件是完全缓冲区,当缓冲区是空时,下一个输入操作将企图填满整个缓││ │冲区。在输出时,在把任何数据写到文件之前,将完全填充缓冲区。 ││_IOLBF│文件是行缓冲区。当缓冲区为空时,下一个输入操作将仍然企图填整个缓││ │冲区。然而在输出时,每当新行符写到文件,缓冲区就被清洗掉。 ││_IONBF│文件是无缓冲的。buf和size参数是被忽略的。每个输入操作将直接从文 ││ │件读,每个输出操作将立即把数据写到文件中。 │└───┴───────────────────────────────┘int fclose(FILE *stream) 关闭一个流,可以是文件或设备(例如LPT1)

        int fcloseall() 关闭所有除stdin或stdout外的流int fflush(FILE *stream)

        关闭一个流,并对缓冲区作处理处理即对读的流,将流内内容读入缓冲区;对写的流,将缓冲区内内容写入流。成功返回0 int fflushall()

        关闭所有流,并对流各自的缓冲区作处理处理即对读的流,将流内内容读入缓冲区;对写的流,将缓冲区内内容写入流。成功返回0 int access(char *filename,int amode)

        本函数检查文件filename并返回文件的属性, 函数将属性存于amode中,amode由以下位的组合构成06可以读、写 04可以读 02可以写 01执行(忽略的) 00文件存在如果filename是一个目录,函数将只确定目录是否存在函数执行成功返回0,否则返回-1 int chmod(char *filename,int permiss) 本函数用于设定文件filename的属性permiss可以为以下值S_IWRITE允许写 S_IREAD允许读 S_IREAD|S_IWRITE允许读、写int _chmod(char *filename,int func[,int attrib]);本函数用于读取或设定文件filename的属性,当func=0时,函数返回文件的属性;当func=1时,函数设定文件的属性若为设定文件属性,attrib可以为下列常数之一FA_RDONLY只读 FA_HIDDEN隐藏 FA_SYSTEM系统

        接口子程序,所在函数库为os.h、bios.h unsigned sleep(unsigned seconds) 暂停seconds微秒(百分之一秒)

        int unlink(char *filename) 删除文件filename unsigned FP_OFF(void far *farptr) 本函数用来取远指针farptr的偏移量unsigned FP_SEG(void far *farptr) 本函数用来没置远指针farptr的段值void far *MK_FP(unsigned seg,unsigned off)根据段seg和偏移量off构造一个far指针unsigned getpsp() 取程序段前缀的段地址,并返回这个地址char *parsfnm(char *cmdline,struct fcb *fcbptr,int option)

        函数分析一个字符串,通常,对一个文件名来说,是由cmdline所指的一个命令行。

        文件名是放入一个FCB中作为一个驱动器,文件名和扩展名。FCB是由fcbptr所指定的。

        option参数是DOS分析系统调用时,AL文本的值。

        int absread(int drive,int nsects,int sectno,void *buffer)

        本函数功能为读特定的磁盘扇区,drive为驱动器号(0=A,1=B等),nsects为要读的扇区数,sectno为开始的逻辑扇区号,buffer为保存所读数据的保存空间int abswrite(int drive,int nsects,int sectno,void *buffer)

        本函数功能为写特定的磁盘扇区,drive为驱动器号(0=A,1=B等),nsects为要写的扇区数,sectno为开始的逻辑扇区号,buffer为保存所写数据的所在空间void getdfree(int drive,struct dfree *dfreep)

        本函数用来取磁盘的自由空间,drive为磁盘号(0=当前,1=A等)。函数将磁盘特性的由dfreep指向的dfree结构中。 dfree结构如下:┌───────────────────┐│struct dfree ││{ ││ unsigned df_avail; /*有用簇个数*/ ││ unsigned df_total; /*总共簇个数*/ ││ unsigned df_bsec; /*每个扇区字节数*/││ unsigned df_sclus; /*每个簇扇区数*/ ││} │└───────────────────┘char far *getdta() 取磁盘转换地址DTA void setdta(char far *dta) 设置磁盘转换地址DTA void getfat(int drive,fatinfo *fatblkp)

        本函数返回指定驱动器drive(0=当前,1=A,2=B等)的文件分配表信息并存入结构fatblkp中,结构如下:┌──────────────────┐│struct fatinfo ││{ ││ char fi_sclus; /*每个簇扇区数*/ ││ char fi_fatid; /*文件分配表字节数*/││ int fi_nclus; /*簇的数目*/ ││ int fi_bysec; /*每个扇区字节数*/ ││} │└──────────────────┘void getfatd(struct fatinfo *fatblkp) 本函数返回当前驱动器的文件分配表信息, 并存入结构fatblkp中,结构如下:┌──────────────────┐│struct fatinfo ││{ ││ char fi_sclus; /*每个簇扇区数*/ ││ char fi_fatid; /*文件分配表字节数*/││ int fi_nclus; /*簇的数目*/ ││ int fi_bysec; /*每个扇区字节数*/ ││} │└──────────────────┘int bdos(int dosfun,unsigned dosdx,unsigned dosal)

        本函数对MSDOS系统进行调用, dosdx为寄存器dx的值,dosal为寄存器al的值,dosfun为功能号int bdosptr(int dosfun,void *argument,unsiigned dosal)

        本函数对MSDOS系统进行调用,argument为寄存器dx的值,dosal为寄存器al的值,dosfun为功能号int int86(int intr_num,union REGS *inregs,union REGS *outregs)

        执行intr_num号中断,用户定义的寄存器值存于结构inregs中, 执行完后将返回的寄存器值存于结构outregs中。

        int int86x(int intr_num,union REGS *inregs,union REGS *outregs, struct SREGS *segregs)

        执行intr_num号中断,用户定义的寄存器值存于结构inregs中和结构segregs中,执行完后将返回的寄存器值存于结构outregs中。

        int intdos(union REGS *inregs,union REGS *outregs)

        本函数执行DOS中断0x21来调用一个指定的DOS函数,用户定义的寄存器值存于结构inregs中,执行完后函数将返回的寄存器值存于结构outregs中int intdosx(union REGS *inregs,union REGS *outregs,struct SREGS *segregs)

        本函数执行DOS中断0x21来调用一个指定的DOS函数,用户定义的寄存器值存于结构inregs和segregs中,执行完后函数将返回的寄存器值存于结构outregs中void intr(int intr_num,struct REGPACK *preg)

        本函数中一个备用的8086软件中断接口它能产生一个由参数intr_num指定的8086软件中断。

        函数在执行软件中断前, 从结构preg复制用户定义的各寄存器值到各个寄存器。软件中断完成后,函数将当前各个寄存器的值复制到结构preg中。参数如下:intr_num 被执行的中断号,preg为保存用户定义的寄存器值的结构,结构如下┌──────────────────────┐│struct REGPACK ││{ ││ unsigned r_ax,r_bx,r_cx,r_dx; ││ unsigned r_bp,r_si,r_di,r_ds,r_es,r_flags; ││} │└──────────────────────┘函数执行完后,将新的寄存器值存于结构preg中void keep(int status,int size)

        以status状态返回MSDOS,但程序仍保留于内存中,所占用空间由size决定。

        void ctrlbrk(int )*fptr()() 设置中断后的对中断的处理程序。

        void disable() 禁止发生中断void enable() 允许发生中断void geninterrupt(int intr_num) 执行由intr_num所指定的软件中断void interrupt(* getvect)int intr_num()()

        返回中断号为intr_num的中断处理程序, 例如: old_int_10h=getvect(0x10);void setvect(int intr_num,void interrupt)* isr()()

        设置中断号为intr_num的中断处理程序为isr,例如: setvect(0x10,new_int_10h);void harderr(int )*fptr()()

        定义一个硬件错误处理程序, 每当出现错误时就调用fptr所指的程序void hardresume(int rescode) 硬件错误处理函数void hardretn(int errcode) 硬件错误处理函数int inport(int prot) 从指定的输入端口读入一个字,并返回这个字int inportb(int port) 从指定的输入端口读入一个字节,并返回这个字节void outport(int port,int word) 将字word写入指定的输出端口port void outportb(int port,char byte) 将字节byte写入指定的输出端口port int peek(int segment,unsigned offset)

        函数返回segmentffset处的一个字char peekb(int segment,unsigned offset)

        函数返回segmentffset处的一个字节void poke(int segment,int offset,char value)

        将字value写到segmentffset处void pokeb(int segment,int offset,int value)

        将字节value写到segmentffset处int randbrd(struct fcb *fcbptr,int reccnt)

        函数利用打开fcbptr所指的FCB读reccnt个记录。

        int randbwr(struct fcb *fcbptr,int reccnt)

        函数将fcbptr所指的FCB中的reccnt个记录写到磁盘上void segread(struct SREGS *segtbl)函数把段寄存器的当前值放进结构segtbl中int getverify() 取检验标志的当前状态(0=检验关闭,1=检验打开)

        void setverify(int value)

        设置当前检验状态, value为0表示关闭检验,为1表示打开检验int getcbrk()本函数返回控制中断检测的当前设置int setcbrk(int value)本函数用来设置控制中断检测为接通或断开当value=0时,为断开检测。当value=1时,为接开检测int dosexterr(struct DOSERR *eblkp)

        取扩展错误。在DOS出现错误后,此函数将扩充的错误信息填入eblkp所指的DOSERR结构中。该结构定义如下:┌──────────────┐│struct DOSERR ││{ ││ int exterror;/*扩展错误*/ ││ char class; /*错误类型*/ ││ char action; /*方式*/ ││ char locus; /*错误场所*/ ││} │└──────────────┘int bioscom(int cmd,char type,int port) 本函数负责对数据的通讯工作,cmd可以为以下值:0 置通讯参数为字节byte值 1 发送字符通过通讯线输出2 从通讯线接受字符 3 返回通讯的当前状态port为通讯端口,port=0时通讯端口为COM1,port=1时通讯端口为COM2,以此类推byte为传送或接收数据时的参数,为以下位的组合:┌───┬─────┬───┬─────┬───┬─────┐│byte值│意义 │byte值│意义 │byte值│意义 │├───┼─────┼───┼─────┼───┼─────┤│0x02 │7数据位 │0x03 │8数据位 │0x00 │1停止位 ││0x04 │2停止位 │0x00 │无奇偶性 │0x08 │奇数奇偶性││0x18 │偶数奇偶性│0x00 │110波特 │0x20 │150波特 ││0x40 │300波特 │0x60 │600波特 │0x80 │1200波特 ││0xA0 │2400波特 │0xC0 │4800波特 │0xE0 │9600波特 │└───┴─────┴───┴─────┴───┴─────┘

        例如:0xE0|0x08|0x00|0x03即表示置通讯口为9600波特,奇数奇偶性,1停止位,8数据位。 函数返回值为一个16位整数,定义如下:第15位 超时第14位 传送移位寄存器空第13位 传送固定寄存器空第12位 中断检测第11位 帧错误第10位 奇偶错误第 9位 过载运行错误第 8位 数据就绪第 7位 接收线信号检测第 6位 环形指示器第 5位 数据设置就绪第 4位 清除发送第 3位 δ接收线信号检测器第 2位 下降边环形检测器第 1位 δ数据设置就绪第 0位 δ清除发送

        int biosdisk(int cmd,int drive,int head,int track, int sector,int nsects,void *buffer)

        本函数用来对驱动器作一定的操作,cmd为功能号, drive为驱动器号(0=A,1=B,0x80=C,0x81=D,0x82=E等)。cmd可为以下值:

        0 重置软磁盘系统。这强迫驱动器控制器来执行硬复位。忽略所有其它参数。

        1 返回最后的硬盘操作状态。忽略所有其它参数2 读一个或多个磁盘扇区到内存。读开始的扇区由head、track、sector给出。扇区号由nsects给出。把每个扇区512个字节的数据读入buffer 3 从内存读数据写到一个或多个扇区。写开始的扇区由head、track、sector给出。扇区号由nsects给出。所写数据在buffer中,每扇区512个字节。

        4 检验一个或多个扇区。开始扇区由head、track、sector给出。扇区号由nsects给出。

        5 格式化一个磁道,该磁道由head和track给出。buffer指向写在指定track上的扇区磁头器的一个表。以下cmd值只允许用于XT或AT微机:6 格式化一个磁道,并置坏扇区标志。

        7 格式化指定磁道上的驱动器开头。

        8 返回当前驱动器参数,驱动器信息返回写在buffer中(以四个字节表示)。

        9 初始化一对驱动器特性。

        10 执行一个长的读,每个扇区读512加4个额外字节11 执行一个长的写,每个扇区写512加4个额外字节12 执行一个磁盘查找13 交替磁盘复位14 读扇区缓冲区15 写扇区缓冲区16 检查指定的驱动器是否就绪17 复核驱动器18 控制器RAM诊断19 驱动器诊断20 控制器内部诊

        函数返回由下列位组合成的状态字节:0x00 操作成功0x01 坏的命令0x02 地址标记找不到0x04 记录找不到0x05 重置失败0x07 驱动参数活动失败0x09 企图DMA经过64K界限0x0B 检查坏的磁盘标记0x10 坏的ECC在磁盘上读0x11 ECC校正的数据错误(注意它不是错误)

        0x20 控制器失效0x40 查找失败0x80 响应的连接失败0xBB 出现无定义错误0xFF 读出操作失败

        int biodquip()

        检查设备,函数返回一字节,该字节每一位表示一个信息,如下:第15位 打印机号第14位 打印机号第13位 未使用第12位 连接游戏I/O第11位 RS232端口号第 8位 未使用第 7位 软磁盘号第 6位 软磁盘号,00为1号驱动器,01为2号驱动器,10为3号驱动器,11为4号驱动器

        第 5位 初始化第 4位 显示器模式00为未使用,01为40x25BW彩色显示卡10为80x25BW彩色显示卡,11为80x25BW单色显示卡第 3位 母扦件第 2位 随机存贮器容量,00为16K,01为32K,10为48K,11为64K第 1位 浮点共用处理器第 0位 从软磁盘引导

        int bioskey(int cmd)本函数用来执行各种键盘操作,由cmd确定操作。

        cmd可为以下值:0 返回敲键盘上的下一个键。若低8位为非0,即为ASCII字符;若低8位为0,则返回扩充了的键盘代码。

        1 测试键盘是否可用于读。返回0表示没有键可用;否则返回下一次敲键之值。

        敲键本身一直保持由下次调用具的cmd值为0的bioskey所返回的值。

        2 返回当前的键盘状态,由返回整数的每一个位表示,见下表:┌──┬───────────┬───────────┐│ 位 │为0时意义 │为1时意义 │├──┼───────────┼───────────┤│ 7 │插入状态 │改写状态 ││ 6 │大写状态 │小写状态 ││ 5 │数字状态,NumLock灯亮 │光标状态,NumLock灯熄 ││ 4 │ScrollLock灯亮 │ScrollLock灯熄 ││ 3 │Alt按下 │Alt未按下 ││ 2 │Ctrl按下 │Ctrl未按下 ││ 1 │左Shift按下 │左Shift未按下 ││ 0 │右Shift按下 │右Shift未按下 │└──┴───────────┴───────────┘int biosmemory() 返回内存大小,以K为单位。

        int biosprint(int cmd,int byte,int port) 控制打印机的输入/输出。

        port为打印机号,0为LPT1,1为LPT2,2为LPT3等cmd可以为以下值:0 打印字符,将字符byte送到打印机1 打印机端口初始化2 读打印机状态函数返回值由以下位值组成表示当前打印机状态0x01 设备时间超时0x08 输入/输出错误0x10 选择的0x20 走纸0x40 认可0x80 不忙碌

        int biostime(int cmd,long newtime)计时器控制,cmd为功能号,可为以下值

        0 函数返回计时器的当前值1 将计时器设为新值newtime

        struct country *country(int countrycmode,struct country *countryp)

        本函数用来控制某一国家的相关信息,如日期,时间,货币等。

        若countryp=-1时,当前的国家置为countrycode值(必须为非0)。否则,由countryp所指向的country结构用下列的国家相关信息填充:(1)当前的国家(若countrycode为0或2)由countrycode所给定的国家。

        结构country定义如下:┌────────────────────┐│struct country ││{ ││ int co_date; /*日期格式*/ ││ char co_curr[5]; /*货币符号*/ ││ char co_thsep[2]; /*数字分隔符*/ ││ char co_desep[2]; /*小数点*/ ││ char co_dtsep[2]; /*日期分隔符*/ ││ char co_tmsep[2]; /*时间分隔符*/ ││ char co_currstyle; /*货币形式*/ ││ char co_digits; /*有效数字*/ ││ int (far *co_case)(); /*事件处理函数*/ ││ char co_dasep; /*数据分隔符*/ ││ char co_fill[10]; /*补充字符*/ ││} │└────────────────────┘co_date的值所代表的日期格式是:0 月日年 1 日月年 2 年月日co_currstrle的值所代表的货币显示方式是0 货币符号在数值前,中间无空格1 货币符号在数值后,中间无空格2 货币符号在数值前,中间有空格3 货币符号在数值后,中间有空格

        操作函数,所在函数库为string.h、mem.h mem…操作存贮数组void *memccpy(void *destin,void *source,unsigned char ch,unsigned n)

        void *memchr(void *s,char ch,unsigned n)

        void *memcmp(void *s1,void *s2,unsigned n)

        int memicmp(void *s1,void *s2,unsigned n)

        void *memmove(void *destin,void *source,unsigned n)

        void *memcpy(void *destin,void *source,unsigned n)

        void *memset(void *s,char ch,unsigned n)

        这些函数,mem…系列的所有成员均操作存贮数组。在所有这些函数中,数组是n字节长。

        memcpy从source复制一个n字节的块到destin.如果源块和目标块重迭,则选择复制方向, 以例正确地复制覆盖的字节。

        memmove与memcpy相同。 memset将s的所有字节置于字节ch中。s数组的长度由n给出。

        memcmp比较正好是n字节长的两个字符串s1和s2.些函数按无符号字符比较字节,因此,memcmp("0xFF","/x7F",1)返回值大于0. memicmp比较s1和s2的前n个字节,不管字符大写或小写。

        memccpy从source复制字节到destin.复制一结束就发生下列任一情况:(1)字符ch首选复制到destin.(2)n个字节已复制到destin. memchr对字符ch检索s数组的前n个字节。

        返回值:memmove和memcpy返回destin memset返回s的值memcmp和memicmp─┬─若s1<s2返回值小于0├─若s1=s2返回值等于0└─若s1>s2返回值大于0 memccpy若复制了ch,则返回直接跟随ch的在destin中的字节的一个指针;

        否则返回NULL memchr返回在s中首先出现ch的一个指针;如果在s数组中不出现ch,就返回NULL.

        void movedata(int segsrc,int offsrc, int segdest,int offdest, unsigned numbytes)

        本函数将源地址(segsrcffsrc)处的numbytes个字节复制到目标地址(segdestffdest)

        void movemem(void *source,void *destin,unsigned len)

        本函数从source处复制一块长len字节的数据到destin.若源地址和目标地址字符串重迭,则选择复制方向,以便正确的复制数据。

        void setmem(void *addr,int len,char value)

        本函数把addr所指的块的第一个字节置于字节value中。

        str…字符串操作函数char stpcpy(char *dest,const char *src) 将字符串src复制到dest char strcat(char *dest,const char *src) 将字符串src添加到dest末尾char strchr(const char *s,int c) 检索并返回字符c在字符串s中第一次出现的位置int strcmp(const char *s1,const char *s2) 比较字符串s1与s2的大小,并返回s1-s2 char strcpy(char *dest,const char *src) 将字符串src复制到dest size_t strcspn(const char *s1,const char *s2) 扫描s1,返回在s1中有,在s2中也有的字符个数char strdup(const char *s) 将字符串s复制到最近建立的单元int stricmp(const char *s1,const char *s2) 比较字符串s1和s2,并返回s1-s2 size_t strlen(const char *s) 返回字符串s的长度char strlwr(char *s)

        将字符串s中的大写字母全部转换成小写字母,并返回转换后的字符串char strncat(char *dest,const char *src,size_t maxlen)

        将字符串src中最多maxlen个字符复制到字符串dest中int strncmp(const char *s1,const char *s2,size_t maxlen)

        比较字符串s1与s2中的前maxlen个字符char strncpy(char *dest,const char *src,size_t maxlen)

        复制src中的前maxlen个字符到dest中int strnicmp(const char *s1,const char *s2,size_t maxlen)

        比较字符串s1与s2中的前maxlen个字符char strnset(char *s,int ch,size_t n)

        将字符串s的前n个字符置于ch中char strpbrk(const char *s1,const char *s2)

        扫描字符串s1,并返回在s1和s2中均有的字符个数char strrchr(const char *s,int c)

        扫描最后出现一个给定字符c的一个字符串s char strrev(char *s)

        将字符串s中的字符全部颠倒顺序重新排列,并返回排列后的字符串char strset(char *s,int ch)

        将一个字符串s中的所有字符置于一个给定的字符ch size_t strspn(const char *s1,const char *s2)

        扫描字符串s1,并返回在s1和s2中均有的字符个数char strstr(const char *s1,const char *s2)

        扫描字符串s2,并返回第一次出现s1的位置char strtok(char *s1,const char *s2)

        检索字符串s1,该字符串s1是由字符串s2中定义的定界符所分隔char strupr(char *s)

        将字符串s中的小写字母全部转换成大写字母,并返回转换后的字符串

        存贮分配子程序,所在函数库为dos.h、alloc.h、malloc.h、stdlib.h、process.h int allocmem(unsigned size,unsigned *seg)

        利用DOS分配空闲的内存, size为分配内存大小,seg为分配后的内存指针int freemem(unsigned seg)

        释放先前由allocmem分配的内存,seg为指定的内存指针int setblock(int seg,int newsize)

        本函数用来修改所分配的内存长度, seg为已分配内存的内存指针,newsize为新的长度int brk(void *endds)

        本函数用来改变分配给调用程序的数据段的空间数量,新的空间结束地址为endds char *sbrk(int incr)

        本函数用来增加分配给调用程序的数据段的空间数量,增加incr个字节的空间unsigned long coreleft() 本函数返回未用的存储区的长度,以字节为单位void *calloc(unsigned nelem,unsigned elsize)

        分配nelem个长度为elsize的内存空间并返回所分配内存的指针void *malloc(unsigned size) 分配size个字节的内存空间,并返回所分配内存的指针void free(void *ptr) 释放先前所分配的内存,所要释放的内存的指针为ptr void *realloc(void *ptr,unsigned newsize)

        改变已分配内存的大小,ptr为已分配有内存区域的指针,newsize为新的长度,返回分配好的内存指针。

        long farcoreleft() 本函数返回远堆中未用的存储区的长度,以字节为单位void far *farcalloc(unsigned long units,unsigned long unitsz)

        从远堆分配units个长度为unitsz的内存空间,并返回所分配内存的指针void *farmalloc(unsigned long size)

        分配size个字节的内存空间, 并返回分配的内存指针void farfree(void far *block)

        释放先前从远堆分配的内存空间, 所要释放的远堆内存的指针为block void far *farrealloc(void far *block,unsigned long newsize)

        改变已分配的远堆内存的大小,block为已分配有内存区域的指针,newzie为新的长度,返回分配好的内存指针

        时间日期函数,函数库为time.h、dos.h在时间日期函数里,主要用到的结构有以下几个:总时间日期贮存结构tm┌──────────────────────┐│struct tm ││{ ││ int tm_sec; /*秒,0-59*/ ││ int tm_min; /*分,0-59*/ ││ int tm_hour; /*时,0-23*/ ││ int tm_mday; /*天数,1-31*/ ││ int tm_mon; /*月数,0-11*/ ││ int tm_year; /*自1900的年数*/ ││ int tm_wday; /*自星期日的天数0-6*/ ││ int tm_yday; /*自1月1日起的天数,0-365*/ ││ int tm_isdst; /*是否采用夏时制,采用为正数*/││} │└──────────────────────┘日期贮存结构date┌───────────────┐│struct date ││{ ││ int da_year; /*自1900的年数*/││ char da_day; /*天数*/ ││ char da_mon; /*月数 1=Jan*/ ││} │└───────────────┘时间贮存结构time┌────────────────┐│struct time ││{ ││ unsigned char ti_min; /*分钟*/││ unsigned char ti_hour; /*小时*/││ unsigned char ti_hund; ││ unsigned char ti_sec; /*秒*/ ││ │└────────────────┘char *ctime(long *clock)

        本函数把clock所指的时间(如由函数time返回的时间)转换成下列格式的字符串:Mon Nov 21 11:31:54 1983/n/0 char asctime(struct tm *tm)

        本函数把指定的tm结构类的时间转换成下列格式的字符串:Mon Nov 21 11:31:54 1983/n/0 double difftime(time_t time2,time_t time1)

        计算结构time2和time1之间的时间差距(以秒为单位)

        struct tm *gmtime(long *clock)

        本函数把clock所指的时间(如由函数time返回的时间)转换成格林威治时间,并以tm结构形式返回struct tm *localtime(long *clock)

        本函数把clock所指的时间(如函数time返回的时间)转换成当地标准时间,并以tm结构形式返回void tzset()本函数提供了对UNIX操作系统的兼容性long dostounix(struct date *dateptr,struct time *timeptr)

        本函数将dateptr所指的日期,timeptr所指的时间转换成UNIX格式, 并返回自格林威治时间1970年1月1日凌晨起到现在的秒数void unixtodos(long utime,struct date *dateptr,struct time *timeptr)

        本函数将自格林威治时间1970年1月1日凌晨起到现在的秒数utime转换成DOS格式并保存于用户所指的结构dateptr和timeptr中void getdate(struct date *dateblk)

        本函数将计算机内的日期写入结构dateblk中以供用户使用void setdate(struct date *dateblk)

        本函数将计算机内的日期改成由结构dateblk所指定的日期void gettime(struct time *timep)

        本函数将计算机内的时间写入结构timep中, 以供用户使用void settime(struct time *timep)

        本函数将计算机内的时间改为由结构timep所指的时间long time(long *tloc)

        本函数给出自格林威治时间1970年1月1日凌晨至现在所经过的秒数,并将该值存于tloc所指的单元中。

        int stime(long *tp)本函数将tp所指的时间(例如由time所返回的时间)写入计算机中

    展开全文
  • 系列课《C语言嵌入式Linux高级编程》视频教程共10期,由一线原厂芯片工程师专门为嵌入式Linux开发精心打造,其深度和广度跟目前市面上的教程完全不是一个级别,没有最深,只有更深。 不同的软件开...

    C语言本质上是编程语言的“通用语言”,在今天仍具有极大的影响力。那么,C语言到底学到什么程度,才能够进行嵌入式内核、驱动的开发?

    本课程为系列课程中的一个小节,入门介绍篇,介绍嵌入式C语言的进阶学习路线。系列课《C语言嵌入式Linux高级编程》视频教程共10期,由一线原厂芯片工程师专门为嵌入式Linux开发精心打造,其深度和广度跟目前市面上的教程完全不是一个级别,没有最深,只有更深。

    不同的软件开发职位,对C语言的要求不同:

    嵌入式开发,对C语言的要求相比其它职位,相对很高。不仅要求学员掌握C语言的基本语法,还要对一下几点有一个更深的理解和掌握。

    1)计算机基本原理、系统架构、ARM汇编语言

    2)程序的编译、链接原理

    3)程序的加载、运行过程

    4)C标准、C编译器对C标准的扩展

    5)对指针的深入理解

    6)嵌入式硬件系统、框架、架构

    7)CPU和多任务并发思想
    http://www.makeru.com.cn/video/1862.html?s=69821

    展开全文
  • 初识Linux下C语言编程

    2015-03-09 21:23:21
    通过本章的学习,可以对在Linux下使用C语言编程有一个基本的了解。 1.1 Linux简介 Linux是能够自由传播并继承了UNIX内核的操作系统,是对UNIX的简化和改进,它既保留了UNIX系统的高安全性,同时也使其操作更加...
    本章将简要介绍一下什么是Linux,C语言的特点,程序开发的预备知识,Linux下C语言开发的环境,程序设计的特点和原则以及编码风格等。通过本章的学习,可以对在Linux下使用C语言编程有一个基本的了解。
    Linux是能够自由传播并继承了UNIX内核的操作系统,是对UNIX的简化和改进,它既保留了UNIX系统的高安全性,同时也使其操作更加简单方便,从而使单机用户也可以使用。UNIX内核指的是操作系统底层的核心程序代码。
    因为 Linux本身脱胎于UNIX系统,所以Linux程序与UNIX程序是十分相似的。事实上,UNIX下编写的各种程序基本上都可以在 Linux下编译和运行。此外,许多在UNIX操作系统下创建的一些商业化应用软件,其二进制形式几乎可以在不作任何修改的情况下直接运行在 Linux系统上。
    Linux是由芬兰的赫尔辛基大学 (Helsinki)学生Linus Torvalds把Minix 系统向x86移植的结果。当时 Linus 手边有个 Minix 系统(UNIX 的一个分支),他对这个操作系统相当有兴趣,由于当时他正好有一台个人计算机,他想把这个系统移植到该计算机(x86 架构)上来使用。由于受益于Stallman提倡的开放源代码(Open Source)思想,他得以接触到UNIX操作系统的一些源代码,并仔细研读了UNIX 的核心,然后去除较为繁复的核心程序,将它改写成能够适用于一般个人计算机的一种操作系统,即Linux系统的雏形。
    1992年1月,大概只有100人开始使用Linux,但他们为Linux的发展壮大作出了巨大贡献。他们对一些不合理的代码进行了改进,修补了代码错误并上传补丁。Linux的腾飞最关键的因素是获得了自由软件基金(FSF)的支持,他们制定了一个GNU计划,该计划的目标就是要编写一个完全免费的 UNIX版本——包括内核及所有相关的组件,可以让用户自由共享并且改写软件,而Linux正好符合他们的意愿。他们将Linux与其现有的GNU应用软件很好地结合起来,使Linux拥有了图形用户界面。
    提示:
    Linux 实际上只是提供了操作系统的内核;它实现了多任务和多用户功能,管理硬件,分配内存,激活应用程序的运行。对初学者来说,最重要的是要明白奇数的内核版本(比如 2.3、2.5、2.7)是实验用的、正在开发的内核。 稳定的、正式发行的内核版本号则是偶数的(比如 2.2、2.4、2.6)。
    1994年3月, Linux 1.0正式版发布,它的出现无异于网络的“自由宣言”。从此Linux用户迅速增加,Linux的核心开发小组也日渐强大。在Linux所包含的数千个文件中,有一个名为Credits的文件,里面列出了100多名对Linux有过重要贡献的黑客,包括他们的名字、地址以及所做的工作。其中的软件都是经过“优胜劣汰”的达尔文式的选择方式保存下来的。Linux的发展方法看起来很简单:所有黑客都可为其添加额外功能并完善其性能。所谓的β测试也不仅是修补漏洞,而是进行集成并进行更多的改进、创新。Linux发展过程中的这种随意性,造成了发展过程中出现了各种各样的Linux版本。
    提示:
    β测试是由软件的多个用户在一个或多个用户的实际使用环境下进行的测试。这些用户是与公司签定了支持产品预发行合同的外部客户,他们要求使用该产品,并愿意返回有关错误信息给开发者。开发者通常不在测试现场,因而,β测试是在开发者无法控制的环境下进行的软件现场应用。在β测试中,由用户记下遇到的所有问题,包括真实的以及主观认定的,定期向开发者报告,开发者在综合用户的报告之后,作出修改,最终将软件产品交付给全体用户使用。由于它处在整个测试的最后阶段,因此不能指望这时发现主要问题。同时,产品的所有手册文本也应该在此阶段完全定稿。
    Linux操作系统在短短的几年之内得到了非常迅猛的发展,这与Linux具有的良好特性是分不开的。Linux几乎包含了UNIX的全部功能和特性,同时又有自己的一些特点。概括地讲,Linux具有以下主要特性:
           开放性
    开放性是指系统遵循世界标准规范,特别是遵循开放系统互联(OSI)国际标准。凡遵循国际标准所开发的硬件和软件,都能彼此兼容,可方便地实现互联。
           多用户
    多用户是指系统资源可以被不同用户各自拥有和使用,即每个用户对自己的资源(例如:文件、设备)有特定的权限,互不影响。Linux继承了UNIX的多用户特性。
           多任务
    多任务是现代计算机的最主要的一个特点。它是指计算机同时执行多个程序,而且各个程序的运行互相独立。Linux系统调度每一个进程,平等地访问微处理器。由于CPU的处理速度非常快,其结果是,启动的应用程序看起来好像在并行运行。事实上,从处理器执行一个应用程序中的一组指令到Linux调度微处理器再次运行这个程序之间只有很短的时间延迟,用户是感觉不出来的。
           良好的用户界面
    Linux向用户提供了3种界面:传统操作界面、系统调用界面和图形用户界面。Linux的传统操作界面是基于文本的命令行界面,即Shell,它既可以联机使用,又可在文件上脱机使用。Shell有很强的程序设计能力,用户可方便地用它编制程序,从而为用户扩充系统功能提供了更高级的手段。可编程Shell是指将多条命令组合在一起,形成一个Shell程序,这个程序可以单独运行,也可以与其他程序同时运行。
    系统调用界面是为用户提供编程时使用的界面。用户可以在编程时直接使用系统提供的系统调用命令。系统通过这个界面为用户程序提供低级、高效率的服务。
    Linux还为用户提供了图形用户界面。它利用鼠标、菜单、窗口、滚动条等设施,给用户呈现一个直观、易操作、交互性强的友好的图形化界面。
           设备独立性
    Linux是具有设备独立性的操作系统,它的内核具有高度的适应能力。随着越来越多的程序员开发Linux系统,将会有更多的硬件设备加入到各种Linux内核和发行版本中。另外,由于用户可以免费得到Linux的内核源代码,因此,用户可以根据需要修改内核源代码,以便适应新增加的外部设备。
    设备独立性是指操作系统把所有外部设备统一当作文件来看待,只要安装它们的驱动程序,任何用户都可以像使用文件一样,操纵、使用这些设备,而不必知道它们的具体存在形式。
    具有设备独立性的操作系统,通过把每一个外围设备看作一个独立文件来简化增加新设备的工作。当需要增加新设备时,系统管理员就在内核中增加必要的连接。这种连接(也称作设备驱动程序)能保证每次调用设备提供的服务时,内核能以相同的方式来处理它们。当新的或更好的外设被开发并交付给用户时,系统允许在这些设备连接到内核后,能不受限制地立即访问它们。设备独立性的关键在于内核的适应能力。其他操作系统只允许一定数量或一定种类的外部设备连接。而设备独立性的操作系统却能够容纳任意种类及任意数量的设备,因为每一个设备都是通过其与内核的专用连接进行独立访问的。
           提供了丰富的网络功能
    完善的内置网络是Linux的一大特点。Linux在通信和网络功能方面优于其他操作系统。其他操作系统不包含如此紧密地和内核结合在一起的连接网络的能力,也没有内置这些联网特性的灵活性。而Linux为用户提供了完善的、强大的网络功能。
    支持Internet是其网络功能之一。Linux免费提供了大量支持Internet的软件,通过Internet,用户能用Linux与世界上各个地区的人方便地通信。它内建了http、ftp、dns等功能,支持所有常见的网络服务,包括ftp、telnet、NFS、TCP、IP等,加上超强的稳定性,因此很多ISP(Internet Service Providers)都是采用Linux来架设邮件服务器、FTP服务器及Web 服务器等各种服务器的。Linux在最新发展的内核中还包含了一些通用的网络协议,比如IPv4、IPv6、AX.25、X.25、IPX、DDP(Appletalk)、NetBEUI、Netrom 等。用户能通过一些Linux命令完成内部信息或文件的传输。 Linux不仅允许进行文件和程序的传输,它还为系统管理员和技术人员提供了访问其他系统的接口。
    另外,还可以进行远程访问。通过这种远程访问的功能,一位技术人员能够有效地为多个系统服务,即使那些系统位于相距很远的地方。稳定的核心中目前包含的网络协议有TCP、IPv4、IPX、DDP、AX等。另外还提供Netware的客户机和服务器,以及现在最热门的Samba(让用户共享Mircosoft Network资源)。
           可靠的系统安全
    Linux采取了许多安全技术措施,包括对读/写进行权限控制、带保护的子系统、审计跟踪、核心授权等,这为网络多用户环境中的用户提供了必要的安全保障。
           良好的可移植性
    可移植性是指将操作系统从一个平台转移到另一个平台上,并使它仍然能按其自身的方式运行的能力。
    Linux是一种可移植的操作系统,能够在从微型计算机到大型计算机的任何环境中运行。可移植性为运行Linux的不同计算机平台与其他任何计算机进行准确而有效的通信提供了手段,不需要另外增加特殊的和昂贵的通信接口。
    1.2 C语言的简介和特点
    C语言是贝尔实验室的Dennis Ritchie在B语言的基础上开发出来的,1972年在一台DEC PDP-11计算机上实现了最初的C语言。C语言是与硬件无关的,用C语言编写的程序能移植到大多数计算机上。C语言在各种计算机上的快速推广导致了许多C语言版本。这些版本虽然是类似的,但通常是不兼容的。为了明确定义与机器无关的C语言,1989年美国国家标准协会制定了C语言的标准(ANSI C)。在ANSI标准化后,C语言的标准在相当长的一段时间内都基本保持不变,尽管C++进行了改进(实际上,Normative Amendment1在1995年已经开发了一个新的C语言版本,但是这个版本很少为人所知)。ANSI标准在20世纪90年代又经历了一次比较大的改进,这就是ISO9899:1999(1999年出版)。这个版本就是通常提及的C99。它被ANSI于2000年2月采用。
    C 语言之所以发展迅速,而且成为最受欢迎的语言之一,主要是因为它具有强大的功能。许多著名的系统软件,如UNIX/Linux、Windows、DBASE Ⅲ PLUS、DBASE Ⅳ 都是由C 语言编写的。用C 语言加上一些汇编语言子程序,就更能显示C 语言的优势,像PC- DOS 、WORDSTAR等就是用这种方法编写的。
    归纳起来,C 语言具有下列特点:
           中级语言。它把高级语言的基本结构和语句与低级语言的实用性结合起来。C 语言可以像汇编语言一样对位、字节和地址进行操作,而这三者是计算机最基本的工作单元。
          结构式语言 。结构式语言的显著特点是代码及数据的模块化,即程序的各个部分除了必要的信息交流外彼此独立。这种结构化方式可使程序层次清晰,便于使用、维护以及调试。C语言是以函数形式提供给用户的, 这些函数可方便地调用, 并采用多种循环、条件语句控制程序流向,从而使程序完全结构化。
           功能齐全。C 语言具有各种各样的数据类型,并引入了指针概念,可使程序效率更高。另外,C 语言也具有强大的图形功能,支持多种显示器和驱动器。而且计算功能、逻辑判断功能也比较强大,可以实现决策目的。   
           可与Linux无缝结合。Linux本身是使用C语言开发的,在Linux上用C语言作开发,效率很高。
    1.3 Linux程序设计基础知识
    对一个Linux开发人员来说,在使用一种编程语言编写程序以前,对操作系统中程序的保存位置有一个透彻的了解是很重要的。比如,应知道软件工具和开发资源保存在什么位置是很重要的。下面首先简单介绍Linux的几个重要的子目录和文件。
    这部分内容虽然是针对 Linux的,但同样也适用于其他类UNIX系统。
    1.3.1 程序安装目录
    Linux下的程序通常都保存在专门的目录里。系统软件可以在/usr/bin子目录里找到。系统管理员为某个特定的主机系统或本地网络添加的程序可以在/usr/local/bin子目录里找到。
    系统管理员一般都喜欢使用/usr/local子目录,因为它可以把供应商提供的文件和后来添加的程序以及系统本身提供的程序隔离开来。/usr子目录的这种布局方法在需要对操作系统进行升级的时候非常有用,因为只有/usr/local子目录里的东西需要保留。我们建议读者编译自己的程序时,按照/usr/local子目录的树状结构来安装和访问相应的文件。
    某些随后安装的软件都有它们自己的子目录结构,其执行程序也保存在特定的子目录里,最明显的例子就是 X窗口系统,它通常安装在一个名为/usr/X11R6的子目录里,XFree论坛组织发行的用于英特尔处理器芯片的各种XFree 86窗口系统变体也安装在这里。
    GNU的C语言编译器gcc(后面的程序设计示例中使用的就是它)通常安装在/usr/bin或者/usr/local/bin子目录里,但通过它运行的各种编译器支持程序一般都保存在另一个位置。这个位置是在用户使用自己的编译器时指定的,随主机类型的不同而不同。对 Linux系统来说,这个位置通常是/usr/lib/gcc-lib/目录下以其版本号确定的某个下级子目录。GN的C/C++编译器的各种编译程序以及GNU专用的头文件都保存在这里。
    1.3.2 头文件
    在使用C语言和其他语言进行程序设计的时候,我们需要头文件来提供对常数的定义和对系统及库函数调用的声明。对C语言来说,这些头文件几乎永远保存在/usr/include及其下级子目录里。那些赖于所运行的 UNIX或Linux操作系统特定版本的头文件一般可以在/usr/include/sys或/usr/include/linux子目录里找到。其他的程序设计软件也可以有一些预先定义好的声明文件,它们的保存位置可以被相应的编译器自动查找到。比如,X窗口系统的/usr/include/X1R6子目录和GNU C++编译器的/usr/include/g++ -2子目录等。
    在调用C语言编译器的时候,可以通过给出“ -I”编译命令标志来引用保存在下级子目录或者非标准位置的头文件,类似命令如下:
    [david@localhost linux]$ gcc -I /usr/openwin/include hello.c
    该命令会使编译器在/usr/openwin/include子目录和标准安装目录两个位置查找fred.c程序里包含的头文件。具体情况可以参考第3章。
    用grep命令来查找含有某些特定定义与函数声明的头文件是很方便的。假设想知道用来返回程序退出状态的文件的名字,可以使用如下方法:
    先进入/usr/include子目录,然后在grep命令里给出该名字的几个字母,如下所示:
    [david@localhost linux]$ grep KEYSPAN *.h
    pci_ids.h:#define PCI_SUBVENDOR_ID_KEYSPAN      0x11a9
    pci_ids.h:#define PCI_SUBDEVICE_ID_KEYSPAN_SX2 0x5334
    grep命令会在该子目录里所有名字以.h结尾的文件里查找字符串“KEYSPAN”。在上面的例子里,(从其他文件中间)可以查找到文件pci_ids.h。
    1.3.3 库文件
    库文件是一些预先编译好的函数的集合,那些函数都是按照可再使用的原则编写的。它们通常由一组互相关联的用来完成某项常见工作的函数构成。比如用来处理屏幕显示情况的函数(curses库)等。我们将在后续章节讲述这些函数库文件。
    标准的系统库文件一般保存在/lib或者/usr/lib子目录里。编译时要告诉 C语言编译器(更确切地说是链接程序)应去查找哪些库文件。默认情况下,它只会查找 C语言的标准库文件。这是从计算机速度还很慢、CPU价格还很昂贵的年代遗留下来的问题。在当时,把一个库文件放到标准化子目录里然后寄希望于编译器自己找到它是不实际的。库文件必须遵守一定的命名规则,还必须在命令行上明确地给出来。
    库文件的名字永远以lib这几个字母打头,随后是说明函数库情况的部分(比如用c表示这是一个 C语言库;而m表示这是一个数学运算库等)。文件名的最后部分以一个句点(.)开始,然后给出这个库文件的类型,如下所示:
           .a 传统的静态型函数库。
           .so和. sa 共享型函数库(见下面的解释)。
    函数库一般分为静态和共享两种格式,用ls /usr/lib命令查一下就能看到。在通知编译器查找某个库文件的时候,既可以给出其完整的路径名,也可以使用–l标志。详细内容可以参考第3章。
    1. 静态库
    函数库最简单的形式就是一组处于可以“拿来就用”状态下的二进制目标代码文件。当有程序需要用到函数库中的某个函数时,就会通过 include语句引用对此函数做出声明的头文件。编译器和链接程序负责把程序代码和库函数结合在一起成为一个独立的可执行程序。如果使用的不是标准的C语言运行库而是某个扩展库,就必须用–l选项指定它。 
    静态库也叫做档案(archive),它们的文件名按惯例都以. a结尾。比如 C语言标准库为/usr/lib/libc.a、X11库为/usr/X11R6/lib/libX11.a等。
    自己建立和维护静态库的工作并不困难,用ar(“建立档案”的意思)程序就可以做到,另外要注意的是,应该用gcc -c命令对函数分别进行编译。应该尽量把函数分别保存到不同的源代码文件里去。如果函数需要存取普通数据,可以把它们放到同一个源代码文件里并使用在其中声明为static类型的变量。
    2. 共享库
    静态库的缺点是,如果我们在同一时间运行多个程序而它们又都使用着来自同一个函数库里的函数时,内存里就会有许多份同一函数的备份,在程序文件本身也有许多份同样的备份。这会消耗大量宝贵的内存和硬盘空间。
    许多UNIX系统支持共享库,它同时克服了在这两方面的无谓消耗。对共享库和它们在不同系统上实现方法的详细讨论超出了本书的范围,所以我们把注意力集中在眼前 Linux环境下的实现方法上。
    共享库的存放位置和静态库是一样的,但有着不同的文件后缀。在一个典型的 Linux系统上,C语言标准库的共享版本是 /usr/lib/libc.so N,其中的N是主版本号。
    1.4 LinuxC语言编程环境概述
    Linux下C语言编程常用的编辑器是vim或emacs,编译器一般用gcc,编译链接程序用make,跟踪调试一般使用gdb,项目管理用makefile。下面先通过一个小程序来熟悉这些工具的基本应用。各个工具的详细使用方法将在后面的各个章节逐步讲解。
    (1) 要编辑C源程序,应首先打开vim或emacs编辑器,然后录入以下多段源代码。使用main函数调用mytool1_print、mytool2_print这两个函数。
     

    #include "mytool1.h"
    #include "mytool2.h"
     
    int main(int argc,char **argv)
    {
    mytool1_print("hello");
    mytool2_print("hello");
    }
    (2) 在mytool1.h中定义mytool1.c的头文件。
     

    /* mytool1.h */
    #ifndef_MYTOOL_1_H
    #define_MYTOOL_1_H
     
    void mytool1_print(char *print_str);
     
    #endif
    (3) 用mytool1.c实现一个简单的打印显示功能。
     

    /* mytool1.c */
    #include "mytool1.h"
    void mytool1_print(char *print_str)
    {
    printf("This is mytool1 print %s/n",print_str);
    }
    (4) 在mytool2.h中定义mytool2.c头文件。
     

    /* mytool2.h */
    #ifndef _MYTOOL_2_H
    #define _MYTOOL_2_H
     
    void mytool2_print(char *print_str);
     
    #endif
    (5) mytool2.c实现的功能与mytool1.c相似。
     

    /* mytool2.c */
    #include "mytool2.h"
    void mytool2_print(char *print_str)
    {
    printf("This is mytool2 print %s/n",print_str);
    }
    (6) 使用makefile文件进行项目管理。makefile文件内容如下。
     

    main:main.o mytool1.o mytool2.o
             gcc -o main main.o mytool1.o mytool2.o
             main.o:main.c mytool1.h mytool2.h
             gcc -c main.c
             mytool1.o:mytool1.c mytool1.h
             gcc -c mytool1.c
             mytool2.o:mytool2.c mytool2.h
             gcc -c mytool2.c
    (7) 将源程序文件和makefile文件保存在Linux下的同一个文件夹下,然后运行make编译链接程序如下:
    [david@localhost 1c]$ make
    [david@localhost 1c]$ ./main
    This is mytool1 print hello
    This is mytool2 print hello
    至此,这个小程序算是完成了,如果想跟踪调试可以参考第4章。
    1.5 Linux程序设计的特点
    在进行程序设计时首先应养成良好的程序设计风格。Linux操作系统的设计师们鼓励人们采用一种独到的程序设计风格。下面是Linux程序和系统所共有的一些特点。
    (1) 简单性。许多最有用的 Linux软件工具都是非常简单的,程序小而易于理解。
    (2) 重点性。一个所谓功能齐全的程序可能既不容易使用,也不容易维护。如果程序只用于一个目的,那么当更好的算法或更好的操作界面被开发出来的时候,它就更容易得到改进。在 Linux世界里,通常会在需求出现的时候把小的工具程序组合到一起来完成一项更大的任务,而不是用一个巨大的程序预测一个用户的需求。
    (3) 可反复性。使用的程序组件把应用程序的核心部分组建成一个库。带有简单而又灵活的程序设计接口并且文档齐备的函数库能够帮助其他人开发同类的项目,或者能够把这里的技巧用在新的应用领域。例如dbm数据库函数库就是一套由不同功能的函数组成的集合,而不是一个单一的数据库管理系统。
    (4) 过滤性。许多Linux应用程序可以用作过滤器,即它们可以把自己的输入转换为另外一种形式的输出。在后面将会讲到,Linux提供的工具程序能够将其他Linux程序组合成相当复杂的应用软件,其组合方法既新颖又奇特。当然,这类程序组合正是由Linux独特的开发方法支撑着的。
    (5) 开放性。文件格式比较成功和流行的 Linux程序所使用的配置文件和数据文件都是普通的 ASCII文本。如果在程序开发中遵循该原则,将是一种很好的做法。它使用户能够利用标准的软件工具对配置数据进行改动和搜索,从而开发出新的工具,并通过新的函数对数据文件进行处理。源代码交叉引用检查软件 ctags就是一个这样的好例子,它把程序中的符号位置信息以规则表达式的形式记录下来供检索程序使用。
    (6) 灵活性。因为你根本无法预测一个不太聪明的用户会怎样使用你的程序,因此在进行程序设计时,要尽可能地增加灵活性,尽量避免给数据域长度或者记录条数加上限制。同时如果可能,应尽量编写能够响应网络访问的程序,使它既能够跨网络运行又能够在本地单机上运行。
    1.6 LinuxC语言编码的风格
    Linux作为GN家族的一员,其源代码数以万计,而在阅读这些源代码时我们会发现,不同的源代码的美观程度和编程风格都不尽相同,例如下面的glibc代码:
    static voidrelease_libc_mem (void)
    {
    /*Only call the free function if we still are running in mtrace mode. */
    if (mallstream != NULL)
    __libc_freeres ();
    }
    或者Linux的核心代码:
    static int do_linuxrc(void * shell)
    static char *argv[] = { "linuxrc"NULL};
    close(0);close(1);close(2);
    setsid();
    (void) open("/dev/console",O_RDWR,0);
    (void) dup(0);
    (void) dup(0);
    return execve(shellargvenvp_init);
    }
    比较一下,上面的这些代码是否看起来让人赏心悦目?而有些程序员编写的程序由于没有很好的缩进及顺序,让人看起来直皱眉头。编写干净美观的代码,不仅仅使代码更容易阅读,还能使代码成为一件艺术品。与微软的匈牙利命名法一样,Linux上的编程主要有两种编程风格:GNU风格和Linux核心风格,下面将分别介绍。
    1.6.1 GNU编程风格
    下面是基于GNU的编程风格,编写代码时应遵循这些基本要求。
           函数开头的左花括号放到最左边,避免把任何其他的左花括号、左括号或者左方括号放到最左边。
    à       尽力避免让两个不同优先级的操作符出现在相同的对齐方式中。
    à       每个程序都应该有一段简短地说明其功能的注释开头。例如:fmt - filter for simplefilling of text。
           请为每个函数书写注释,以说明函数做了些什么,需要哪些种类的参数,参数可能值的含义以及用途。
    à      不要在声明多个变量时跨行。在每一行中都以一个新的声明开头。
    à      当在一个if语句中嵌套了另一个if-else语句时,应用花括号把if-else括起来。
          要在同一个声明中同时说明结构标识和变量,或者结构标识和类型定义(typedef)。
    à       尽力避免在if的条件中进行赋值。
    à       请在名字中使用下划线以分隔单词,尽量使用小写; 把大写字母留给宏和枚举常量,以及根据统一的惯例使用的前缀。
    à       命令一个命令行选项时,给出的变量应该在选项含义的说明之后,而不是选项字符之后。
    1.6.2 Linux内核编程风格
    下面是 Linux 内核所要求的编程风格:
           注意缩进格式。
           将开始的大括号放在一行的最后,而将结束大括号放在一行的第一位。
           命名系统。变量命名尽量使用简短的名字。
           函数最好要短小精悍,一个函数最好只作一件事情。
           注释。注释说明代码的功能,而不是说明其实现原理。
    看了上面两种风格的介绍,读者是不是觉得有些太多了,难以记住?不要紧,Linux有很多工具来帮助我们。除了vim和emacs以外,还有一个非常有意思的小工具 indent可以帮我们美化C/C++源代码。
    下面用这条命令将Linux 内核编程风格的程序quan.c转变为 GNU编程风格,代码如下:
    [david@localhost ~]$ indent -gnu quan.c
    利用indent这个工具,大家就可以方便地写出漂亮的代码来。
     
     
     
     
     
     
    2 viemacs编辑器
    从本章开始,我们将进入Linux充满挑战的C语言编程世界,首先介绍的是文本编辑器。
    文本编辑器可以说是计算机最基本的应用,修改设置文件、编写程序或者建立文件都需要用到它。Linux提供了齐全的文本编辑器,可以让用户按照自己的喜好进行选择。本章主要介绍vim、emacs等编辑器,对Linux其他的编辑器也稍作介绍。通过本章的学习,可以对Linux下的编辑器有一个深入的了解,为今后编程打下良好基础。
    2.1 vim概述及应用
    vim(vi improve)可以说是Linux中功能最为强大的编辑器,它是由UNIX系统下的传统文本编辑器vi发展而来的。下面首先介绍一下vi。
    vi是个可视化的编辑器(vi就意味着可视化——visual)。 那么,什么是可视化的编辑器呢?可视化的编辑器就是可以在编辑文本的时候看到它们。非可视化的编辑器的例子可以举出不少,如ed、sed和edlin(它是DOS自带的最后一个编辑器) 等。vi成为BSD UNIX的一部分,后来AT&T也开始用vi,于是标准UNIX也开始 用vi。Linux下的vim是vi的一个增强版本,有彩色和高亮等特性,对编程有很大的帮助。
    1. 启动与退出vim
    由于vim的功能很多,首先来看如何启动和退出vim。
    (1) 在Linux提示符下键入vim(或使用vim myfile来编辑已经存在的文件)即可启动它。
    (2) 要退出vim,先按下Esc键回到命令行模式,然后键入“:”,此时光标会停留在最下面一行,再键入“q”,最后按下Enter键即可,见图2-1。
    技巧:
    在X-Window下也可以通过在“开始”菜单里找到“编程”︱ViI Mproved来运行X-Window下的vim。此时其界面如图2-2所示。
    图2-1 退出vim
    图2-2 X-Window下的vim界面
    2. 命令行模式的操作
    命令行模式提供了相当多的按键及组合按键来执行命令,帮助用户编辑文件。由于这些命令相当多,在此仅作简单介绍。
    (1) 移动光标
    在命令行模式和插入模式下,都可以使用上、下、左、右4个方向键来移动光标的位置。但是有些情况下,如使用telnet远程登陆时,方向键就不能用,必须用命令行模式下的光标移动命令。这些命令及作用见表2-1。
     
    表2-1 常用的移动光标的命令
       
    操 作 说 明
    h
    将光标向左移动一格
    l
    将光标向右移动一格
    j
    将光标向上移动一格
    k
    将光标向下移动一格
    0
    将光标移动到该行的最前面
    $
    将光移动到该行的最后面
    G
    将光标移动到最后一行的开头
    W或w
    将光标移动到下一个字
    e
    将光标移动到本单词的最后一个字符。如果光标所在的位置为本单词的最后一个字符,则跳动到下一个单字的最后一个字符。标点符号如“.”、“,”或“/”等字符都会被当成一个字
    b
    将光标移动到单词的最后一个字符,如果光标所在位置为本单词的第一个字符,则跳到上一个单词的第一个字符
    {
    将光标移动到前面的“{”处。在C语言编程时,如果按两次就会找到函数开头“{”处,如果再次连续按两次还可以找到上一个函数的开头处
    }
    同“{”的使用,将光标移动到后面的“}”
    Ctrl+b
    如果想要翻看文章的前后,可以使用Page Down和Page Up;但当这两个键不能使用时,可以使用Ctrl+b将光标向前卷一页,相当于Page Up
    Ctrl+f
    将光标向后卷一页,相当于Page Down
    Ctrl+u
    将光标向前移半页
    Ctrl+d
    将光标向后移半页
    Ctrl+e
    将光标向下卷一行
    Ctrl+y
    将光标向后卷一行
    N+/
    将光标移至第n行(n为数字)
    (2) 复制文本
    复制文本可以节省重复输入的时间,vim也提供了以下的操作命令,见表2-2。
    表2-2 常用的复制文本的命令
       
    操 作 说 明
    y+y
    将光标目前所在的位置整行复制
    y+w
    复制光标所在的位置到整个单词所在的位置
    n+y+w
    若输入3yw,则会将光标所在位置到单词结束以及后面两个单词(共3个单词)一起复制
    n+y+y
    若按3yy,则将连同光标所在位置的一行与下面两行一起复制
    p
    将复制的内容粘贴光标所在的位置。若复制的是整行文本,则会将整行内容粘贴到光标所在的位置
    (3) 删除文本
    删除文本命令一次可删除一个字符,也可以一次删除好几个字符或是整行文本,见表2-3。
    表2-3 常用的删除文本的命令
       
    操 作 说 明
    d+左方向键
    连续按d和左方向键,将光标所在位置前一个字符删除
    d+右方向键
    将光标所在位置字符删除
    d+上方向键
    将光标所在位置行与其上一行同时删除
    d+下方向键
    将光标所在位置行与下一行同时删除
    d+d
    连按两次d,可将光标所在的行删除,若是连续删除,可以按住d不放
    d+w
    删除光标所在位置的单词,若是光标在两个字之间,则删除光标后面的一个字符
    n+d+d
    删除包括光标所在行及向下的n行(n为数字)
    n+d+上方向键
    删除包括光标所在行及向上的n行
    n+d+下方向键
    同n+d+d命令
    D
    将光标所在行后所有的单词删除
    x
    将光标所在位置的字符删除
    X
    将光标所在位置前一个字符删除
    n+x
    删除光标所在位置及其后的n个字符
    n+X
    删除光标所在位置及其前的n个字符
     
    (4) 找出行数及其他按键
    当我们编写程序时,常常需要跳到某一行去修改,因此每一行的行号就相当重要。vim为此提供的命令见表2-4。
    表2-4 常用的找出行数的命令
       
    操 作 说 明
    Ctrl+g
    在最后一行中显示光标所在位置的行数及文章的总行数
    nG
    将光标移至n行(n为数字)
    r  
    修改光标所在字符
    R
    修改光标所在位置的字符,可以一直替换字符,直到按下ESC键
    u
    表示复原功能
    U
    取消对行所做的所有改变
    .
    重复执行上一命令
    Z+Z
    连续两次输入z,表示保存文件并退出vi
    %
    符号匹配功能,在编辑时,如果输入“%(”,系统将会自动匹配相应的“)”
    3. 命令行模式切换到输入模式
    进入vim时,默认的模式是命令行模式,而要进入输入模式输入数据时,可以用下列按键:
           按“a”键 从目前光标所在位置的下一个字符开始输入。
           按“i”键 从光标所在位置开始插入新输入的字符。
           按“o”键 新增加一行,并将光标移到下一行的开头。
    4. 最后行模式的操作
    vim的最后行模式是指可以在界面最底部的一行显示的输入命令,一般用来执行查找特定的字符串、保存及退出等任务。在命令行模式下输入冒号“:”,就可以进入最后行模式了,还可以使用“?”和“/”键进入最后行模式。比起命令行模式的诸多操作命令,最后行模式的操作命令就少多了,见表2-5。
    表2-5 最后行模式主要的操作命令
       
    操 作 说 明
    e
    在vi中编辑时,可以使用e创建新的文件
    n
    加载新文件
    w
    写文件,也就是将编辑的内容保存到文件系统中。vim在编辑文件时,先将编辑内容保存在临时文件中,如果没有执行写操作直接退出的话,修改内容并没有保存到文件中
    w!
    如果想写只读文件,可以使用w!强制写入文件
    q!
    表示退出vim,但是文件内容有修改的话,系统会提示要先保存,如果不保存退出,需要使用命令q!强制退出
    set nu
    set可以设置vim 的某些特性,这里是设置每行开头提示行数。想取消设置,使用命令set none
    /
    查找匹配字符串功能。在编辑时,想查找包含某一个字符串,可以用“/字符串”自动查找,系统会突出显示所有找到的字符串,并转到找到的第一个字符串。如果想继续向下查找,可以按n键;向前继续查找则按N键
    也可以使用“?字符串”查找特定字符串,它的使用与“/”相似,但它是向前查找字符串
     
    5. vim的注意事项
    由于Linux系统的vim编辑器是从UNIX下的vi发展而来的,而UNIX下的vi编辑器是从行编辑器ed发展而来的。因此,vim不如目前流行的微软推出的同类编辑器易用、直观,但是它的强大功能却是微软同类产品无法比拟的。因此一些人学习时可能会感到有一些不便和困惑。针对这类问题,这里列出了使用vim中应注意的一些事项。当然要熟练使用vim,还需要平时操作中不断地提高和积累。
           插入编辑方式和命令方式切换时出现混乱
    这种情况产生的原因通常是:还未输入插入命令便开始进行文本输入,从而无法在正确位置输入文本;另外,当插入信息后,还未按Esc键结束插入方式,就又输入其他的命令信息,从而使命令无法执行。
    当出现这种情况时,首先要确定自己所处的操作方式,然后再确定下一步做什么工作。若不易搞清楚当前所处的状态,还可以使用Esc键退回到命令方式重新进行输入。
           在进行文档编辑时,vim编辑器会产生混乱
    这种状态的产生往往是由于屏幕刷新有误,此时可以使用Ctrl+l键对屏幕进行刷新,如果是在终端,可以用Ctrl+r进行屏幕刷新。
           对屏幕中显示的信息进行操作时,系统没有反应。
     出现这种情况可能是由于屏幕的多个进程被挂起(如不慎用了Ctrl+s键等),此时可用Ctrl+q进行解脱,然后重新进行输入。
           当编辑完成后,不能正确退出vim
    出现这种情况的原因可能是系统出现了意外情况。如:文件属性为只读、用户对编辑的文件没有写的权限。如果强行执行退出命令“:w!”仍无法退出,可以用“:w newfile”命令将文件重新存盘后再退出,以减少工作中的损失,这个新文件newfile应是用户有写权限的文件。
    如果暂时没有可以使用的文件,可以借用/tmp目录建一个新的文件。因为Linux系统中的/tmp是一个临时目录,系统启动时总要刷新该目录,因此操作系统一般情况下不对此目录下进行保护。但当处理完成后,切记应将新文件进行转储,否则依然会造成信息损失。
           在使用vim时,万一发生了系统掉电或者突然当机的情况怎么办?
    工作时发生了掉电和当机,对正做的工作无疑是一种损失,但是vim程序可使损失降到最小。因为,对vim的操作实际上是对编辑缓冲区的数据操作,而系统经常会将缓冲区的内容自动进行保存。因此,当机后用户可以在下次登陆系统后使用-r选项进入vi,将系统中最后保存的内容恢复出来。例如,在编辑cd文件的时候突然断电或者系统崩溃后的恢复命令为:
    [david@DAVID david]$ vi cd -r
    vim的学习应侧重于实际的应用,在了解vim的使用规则后应该多上机操作,不断积累经验,逐步地使自己成为vi编辑能手。
    2.2 emacs简介及应用
    emacs编辑器是一款自由软件产品,在Linux系统中比较流行。emacs的涵义是宏编辑器(macro editor)。emacs最开始是由richard stallman编写的,他的初衷是将emacs设计成一个Linux的shell,同时还增加了一些现代操作系统应支持的用户环境(比如,mail的收发、web的查询、新闻阅读、日志功能等)。另外,在emacs中还包括了list语言的解释执行功能。
    emacs的一个缺点是它占用的磁盘空间比较大,因此为了支持用户的使用,emacs提供多种模式以适用于不同的用户需求。进行安装时,可根据选项设置指定的模式,以减少磁盘的使用量。
    1. emacs的启动和退出
    emacs中包含的命令很多,对于初学者来说有一些困难,但是一旦适应了它的使用方法,就会感到它的方便和灵活。
    在文本模式下要进入emacs,只要键入emacs即可:
    [david@DAVID david]$ emacs
    或者键入emacs [filename]来编辑文件:
    [david@DAVID david]$ emacs [filename]
    启动emacs后,看到的是emacs的基本情况描述信息。
    File Edit Options Buffers Tools Help
    Welcome to GNU Emacs, one component of a Linux-based GNU system.
     
    Get help                       C-h (Hold down CTRL and press h)
    Undo changes         C-x u       Exit Emacs                             C-x C-c
    Get a tutorial             C-h t       Use Info to read docs    C-h i
    Ordering manuals                   C-h RET
    Activate menubar F10 or ESC ' or   M-'
    ('C-' means use the CTRL key. 'M-' means use the Meta (or Alt) key.
    If you have no Meta key, you may instead type ESC followed by the
    character.)
     
    GNU Emacs 21.2.1 (i386-redhat-Linux-gnu, X toolkit, Xaw3d scroll bars)
     of 2003-02-20 on porky.devel.redhat.com
    Copyright (C) 2001 Free Software Foundation, Inc.
     
    GNU Emacs comes with ABSOLUTELY NO WARRANTY; type C-h C-w for full details.
    Emacs is Free Software--Free as in Freedom--so you can redistribute
    copies
    of Emacs and modify it; type C-h C-c to see the conditions.
    Type C-h C-d for information on getting the latest version.
     
    -uuu:---F1 *scratch* (Lisp Interaction)--L1--All--------
    [35dFor information about the GNU Project and its goals, type C-h C-p.
     
    提示:
    要退出 emacs,只要键入Ctrl+x或Ctrl+c即可。 即先按住键盘上的 Ctrl 键不放,再按下英文字母x或c 即可。当然启动或退出 emacs 的方法还有多种,将在以下各小节中陆续介绍。
    技巧:
    在X-Window下也可以通过在“开始”菜单里找到“编程”︱emacs来运行X-Window下的emacs,见图2-3。
    图2-3 X-Window下的emacs
    2. 文本编辑
    在emacs中的文本编辑的方式与vim的编辑方式有很大的区别,现在只简单介绍一些常用操作。
    (1) 删除文本
           删除光标左侧的字符:按Delete键可删除光标左侧的字符。
           删除光标所在的字符:按Ctrl+d键可删除光标所在的字符。
           删除光标左侧单词:按Alt+Delete键可删除光标左侧的单词。
           删除光标右侧单词:按Alt+d键可以删除光标右侧的单词。
           删除至行尾:按Ctrl+k键可以从光标处开始删除至尾行。
           删除多行:不要移动光标,连续在同一位置按Ctrl+k键。
           删除一个句子:按Alt+k从光标处开始删到句子尾。
    (2) 行的分割、合并与新增
           分割一行:在要分割处按下Enter键。
           合并两行:在行尾处按Ctrl+d或于次行首按Delete。
           新增空白行:按Ctrl+e将光标移至尾行再按下Enter键。
    (3) 命令的复原与取消
           复原上一个命令:按下Ctrl+x u、Ctrl +/或Ctrl+_ (同时按下Ctrl+Shift+_3个键),可以恢复到上一个命令。
           取消目前再执行的命令:按Ctrl+g可以取消目前正在执行的命令,按错命令时可用此按键取消。
    (4) 剪切与粘贴
    在了解剪切(cut)与粘贴文本的按键操作前,先了解一下删除与剪切命令的区别。
          删除:凡是一次只删除一个字符的按键命令多属于删除命令,如上述的DeleteCtrldAltDeleteAltd等按键。使用这些按键所删除的字符无法被恢复。
           剪切:剪切命令可以将选择的内容复制到粘贴板上,并将原文中的内容删除。上面提到的Ctrl+k、Alt+k等按键就是剪切命令。
           粘贴:按Ctrl+y会将当前粘贴板上的内容复制到光标所在位置。
    (5) 复制文本与区块
           复制文本:先剪切,再粘贴。可以在选择完内容后按Ctrl+k剪切文本,再按Ctrl+y复制文本。
           复制区块:在一个地方(A)按下Ctrl+Spase或Ctrl+@ (Ctrl+Shift+2)使它成为一个表示点,将光标移至另一处(B),再按下Alt+w,可将A与B之间的文本复制到系统的内存中,稍后可用粘贴命令将它们粘贴回来。
    3. 查找与替换
    (1) 一般查找
    emacs中可用CtrlsCtrlr两组命令进行渐进式查找。其中Ctrls会从光标所在的位置向文件尾方向查找,而Ctrlr则是从光标所在的位置向文件头的方向查找。
    按下Ctrl+s或Ctrl+r后,响应区会出现:
    -search:
    或者出现
    -search backward:
    可以在响应区输入要查找的文本,并按Enter键,光标便会移至符合查找条件的字符串位置,此时可以继续按Ctrl+s键,将光标移至下一个符合查找条件的字符串,或按Ctrl+r键,将光标移至上一个符合条件的字符串。
     
    如果查找失败,就会出现如下的信息:
    Failing I-search: sdfsdfsdfsdfsdfsdfsd
    (2) 替换全部字符串
    使用此功能,可将光标后所有的匹配字符串一次性替换掉,系统并不会询问用户来进行确认,因此使用时要特别小心。操作过程如下:
    按Alt+x键,并于响应区输入“replace-string”(实际输入时要使用替换文本),即可开始字符串的替换。在提示符后面输入原始的字符串,并按Enter键,再在提示符后输入替换后的新字符串,即可替换光标后所有匹配的字符串。
    (3) 选择性替换
    选择性替换就是在替换时询问一下用户的意见,然后根据指示来决定是否替换。操作过程如下:
    按下Alt+x键,于响应区输入“query-replace”,即可进行选择性替换,并在提示符后输入原始字符串,按Enter键,再提示输入替换后的新字符串。此时如果系统发现可替换的字符串,可按Enter键进行替换、按n键跳至下一个匹配的字符串,或按q键中止替换操作。操作的更详细说明可按F1键获得。
    2.3 Linux下的其他编辑器
    前两节介绍的vim和emacs都是Linux下的最常用的编辑器,尽管功能强大,但是操作也比较复杂,本节介绍两款操作简单的编辑器,即ed和pico。
    2.3.1 最简单的文本编辑器ed
    ed可以说是Linux下功能最简单的编辑器。ed一次仅能编辑一行,而非以全屏的方式来操作。
    要进入ed编辑环境,只需要在命令行输入ed即可:
    [david@DAVID david]$ ed
    ed有两种模式,分别是命令行模式与输入模式。当第一次执行ed时,进入的是ed的命令行模式,此模式下只能执行一些命令。由于进入ed后没有任何的说明文本,如果输入的命令不正确,则会出现问号“?”。如下代码所示,表示ed无法确认当前的操作,此时应重新输入正确命令。
    [david@DAVID david]$ ed
    david
    ?
    Linux
    ?
    1. 输入文本
    由于命令行模式仅能输入命令,因此要开始编辑文件内容,必须转到输入模式。进入编辑模式有3种方式,见表2-6。
    表2-6 输入模式下3种输入方式
       
    操 作 说 明
    A
    将新输入的内容接在最后一行后面
    i
    将新输入的内容加到最后输入的一行的前一行
    c
    将新输入的内容替换原来的最后一行
     
    下面是三个命令的应用实例。
     a命令应用实例:
    [david@DAVID david]$ ed
    a
    i am david
    i'm a Linuxer
     i命令应用实例:
    [david@DAVID david]$ ed
    a
    i am david
    .
    i
    i am a Linuxer
    c命令应用实例:
    [david@DAVID david]$ ed
    a
    i am david
    .
    c
    i am david
    如果想编辑一个已经存在的文件(比如david.txt),则可用下面的方式来执行ed:
    [david@DAVID david]$ ed david.txt
    11
    提示:
    ed无法让用户一次看到全部的内容,但是可以在命令行模式下看到最后输入的一行,例如:
    [david@DAVID david]$ ed david.txt
    11
    .
    i am david
    2. 插入一行
    若输入内容后,想在前面插入一行,则可输入i:
    [david@DAVID david]$ ed
    a
    i am david
    i am a Linuxer
    .
    i
    i love xueer    这一行将插入到“i am a Linuxer”之前
    3. 存盘和退出
    当建立文件时或完成编辑后,可以随时在命令行模式输入“w”保存文件,而要退出则输入“q”即可:
    [david@DAVID david]$ ed
    a
    i am david
    i am a Linuxer
    .
    i
    i love xueer
    .
    w xueer.txt   将文件保存为xueer.txt。如果是编辑已有的文件,则输入“w”即可
    47
    q             退出ed
    [david@DAVID david]$   回到Linux提示符下
    以上对Linux下的ed作了简单的介绍,虽然ed的功能不是太强,但当我们只需建立一个简单的文件时,也不失为一个相当方便的工具。
    2.3.2 最容易上手的编辑器pico
    如果觉得vim和emacs太难学,而ed功能又太简单,那么不妨试试pico。pico的使用界面有点像DOS下的PE2,即使是第一次使用的人也能够很快熟悉这种操作方式。这是Linux下最容易使用的入门级文本编辑器。
    1. pico的编辑环境
    可以在Linux提示符下执行pico(或者执行pico filename 加载一个文件)来启动它:
    UW PICO(tm) 4.2                New Buffer
     
    ^G Get Help ^O WriteOut ^R Read File ^Y Prev Pg ^K Cut Text ^C Cur Pos
    ^X Exit ^J Justify ^W Where is ^V Next Pg ^U UnCut Text^T To Spell
    pico不像其他编辑器那样有命令行模式与输入模式之分,用户可以直接在编辑区输入文本。按Enter键可换行,按空格键可将光标向右移动。当要删除字符时,将光标移动到该字符的右边,然后按Backspace键即可删除(按Delete键无效)。
    2. pico的操作按键
    在pico编辑环境的下方,有两排共12组操作按键,这些只是最常用的部分,其他比较少用的操作按键没有列出来。下面分别详述其功能。
    (1) 显示辅助功能—— Ctrl+G
    按Ctrl+G出现pico的帮助文档,再按Ctrl+V显示下一页,里面会列出所有的操作按键(除了这里介绍的12个之外,还有约12个操作按键,试试看)。
    UW PICO(tm) 4.2                New Buffer
     
    Pico is designed to be a simple, easy-to-use text editor with a
    layout very similar to the pine mailer. The status line at the
    top of the display shows pico's version, the current file being
    edited and whether or not there are outstanding modifications
    that have not been saved. The third line from the bottom is used
    to report informational messages and for additional command input.
    The bottom two lines list the available editing commands.
     
    Each character typed is automatically inserted into the buffer
    at the current cursor position. Editing commands and cursor
    movement (besides arrow keys) are given to pico by typing
    special control-key sequences. A caret, '^', is used to denote
    the control key, sometimes marked "CTRL", so the CTRL-q key
    combination is written as ^Q.
     
    The following functions are available in pico (where applicable,
    corresponding function key commands are in parentheses).
     
    ^G (F1)   Display this help text.
     
    ^F        move Forward a character.
    ^B        move Backward a character.
    ^P        move to the Previous line.
    ^N        move to the Next line.
    ^A        move to the beginning of the current line.
    ^E        move to the End of the current line.
    ^V (F8)   move forward a page of text.
    ^Y (F7)   move backward a page of text.
                        [ Unknown Command. ]
     
    ^X Exit Help                           ^V Next Pg
    (2) 保存文件——Ctrl+O
    按Ctrl+O后,操作会变成下面这个样子:
    File Name to write : LINUX.TXT 输入文件名后按Enter键即可
    ^G Get Help ^T To Files
    ^C Cancel    TAB Complete
    注意:
    此处出现的几个操作按键,其中Ctrl+C显示当前内容对应的帮助文档,与Ctrl+G不同,Ctrl+C表示不保存内容而返回到原来的编辑环境。Ctrl+T会显示目录,由用户选择要保存为哪一个文件。TAB则会帮用户添上完整的文件名称。
    (3) 插入文件——Ctrl+R
    按Ctrl+R可以在文件中插入一个文本文件的内容。
    File to insert from home directory: /home/david/david.txt 此处输入要插
    入的文件的名称
    ^G Get Help ^T To Files
    ^C Cancel
    (4) 滚动页面Ctrl+Y、Ctrl+C
    按Ctrl+Y可切换到前一页,如同按下PageUp; 按Ctrl+Y 可以切换到下一页,如同按下PageDown。
    (5) 剪切和粘贴整行文本——Ctrl+K、Ctrl+U
    当要剪切整行文本时,可将光标移动到要剪切的那一行,然后按Ctrl+K。当剪切之后在其他位置粘贴的时候,则将光标移动到粘贴的位置的下一行,再按Ctrl+U。用户也可以连续按3次 Ctrl+K 剪切3行(中间不可以有其他按键),再将光标移动到要粘贴的位置,然后按Ctrl+U。如单独使用Ctrl+K,就如同删除整行的操作按键。
    (6) 自动调整文本的对齐——Ctrl+J、Ctrl+U
    在输入文本的时候,可能没有注意到文本排列的美观,而造成每一行有长有短参差不齐的情况:
    UW PICO(tm) 4.2   New Buffer                       Modified
     
    hello david
    i love Linux
    i am a liuxer how are you i am fine and you
    此时若将光标放到调整的段落中,然后按下Ctrl+J,则整段文本会重新对齐,如下所示:
    UW PICO(tm) 4.2     New Buffer                         Modified
     
    hello david i love Linux i am a liuxer how are you i am fine and you
    每一次Ctrl+J只对一个段落起作用,如果觉得pico对齐的样子还比不上原来的好看,此时不要移动光标(只要一移动就不能恢复了),接着按Ctrl+Uj即可恢复。
    (7) 查找字符串——Ctrl+W
    若要在文章中查找某一个字符串,按Ctrl+W。
    Search : Linux
    ^G Get Help ^Y First Line ^T LineNumber^O End of Par
    ^C Cancel    ^V Last Line ^W Start of P
    (8) 显示目前光标的位置——Ctrl+C
    在pico中不能显示行号,因此我们可能会不知道目前光标所在的位置,但是只要按Ctrl+C,就会显示光标在全部行数中的第几行了。
    (9) pico还可以按Ctrl+T检查拼写错误
    UW PICO(tm) 4.2     New Buffer                       Modified
     
    hello david
    i love Linux
    i am a liuxer how are you i am fine and you
     
     
    Edit a replacement: david
    ^G Get Help
    ^C Cancel
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
    3 gcc
    Linux的各发行版中包含了很多软件开发工具,它们中的很多是用于C和C++应用程序开发的。本章将介绍如何使用Linux下的C 编译器和其他C编程工具。
    3.1 gcc 简 介
    在为Linux开发应用程序时,绝大多数情况下使用的都是C语言,因此几乎每一位Linux程序员面临的首要问题都是如何灵活运用C编译器。目前Linux下最常用的C语言编译器是gcc(GNU Compiler Collection),它是GNU项目中符合ANSI C标准的编译系统,能够编译用C、C++和Object C等语言编写的程序。gcc不仅功能十分强大,结构也异常灵活。最值得称道的一点就是它可以通过不同的前端模块来支持各种语言,如Java、Fortran、Pascal、Modula-3和Ada等。gcc是可以在多种硬体平台上编译出可执行程序的超级编译器,其执行效率与一般的编译器相比,平均效率要高20%~30%。gcc支持编译的一些源文件的后缀及其解释见表3-1。
    表3-1 gcc所支持的语言
    后 缀 名
    所支持的语言
    .c
    C原始程序
    .C
    C++原始程序
    .cc
    C++原始程序
    .cxx
    C++原始程序
    .m
    Objective-C原始程序
    .i
    已经过预处理的C原始程序
    .ii
    已经过预处理的C++原始程序
    .s
    组合语言原始程序
    .S
    组合语言原始程序
    .h
    预处理文件(标头文件)
    .o
    目标文件
    .a
    存档文件
     
    开放、自由和灵活是Linux的魅力所在,而这一点在gcc上的体现就是程序员通过它能够更好地控制整个编译过程。
    在使用gcc编译程序时,编译过程可以细分为4个阶段:
           预处理(Pre-Processing)
           编译(Compiling)
           汇编(Assembling)
           链接(Linking)
    Linux程序员可以根据自己的需要让gcc在编译的任何阶段结束,检查或使用编译器在该阶段的输出信息,或者对最后生成的二进制文件进行控制,以便通过加入不同数量和种类的调试代码来为今后的调试做好准备。与其他常用的编译器一样,gcc也提供了灵活而强大的代码优化功能,利用它可以生成执行效率更高的代码。
    gcc提供了30多条警告信息和3个警告级别,使用它们有助于增强程序的稳定性和可移植性。此外,gcc还对标准的C和C++语言进行了大量的扩展,提高了程序的执行效率,有助于编译器进行代码优化,能够减轻编程的工作量。
    3.2 使 用 gcc
    gcc的版本可以使用如下gcc –v命令查看:
    [david@DAVID david]$ gcc -v
    Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/3.2.2/specs
    Configured with: ../configure --prefix=/usr --mandir=/usr/share/man
    --infodir=/
    sr/share/info --enable-shared --enable-threads=posix
    --disable-checking --with-
    ystem-zlib --enable-__cxa_atexit --host=i386-redhat-linux
    Thread model: posix
    gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)
    以上显示的就是Redhat linux 9.0里自带的gcc的版本3.2.2。
    下面将以一个实例来说明如何使用gcc编译器。例3-1能够帮助大家迅速理解gcc的工作原理,并将其立即运用到实际的项目开发中去。
    实例3-1 hello.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­
     

    #include <stdio.h>
    int main (int argc,char **argv) {
    printf("Hello Linux/n");
    }
    要编译这个程序,只要在命令行下执行如下命令:
    [david@DAVID david]$ gcc hello.c -o hello
    [david@DAVID david]$ ./hello
    Hello Linux
    这样,gcc 编译器会生成一个名为hello的可执行文件,然后执行./hello就可以看到程序的输出结果了。
    命令行中 gcc表示用gcc来编译源程序,-o 选项表示要求编译器输出的可执行文件名为hello ,而hello.c是源程序文件。从程序员的角度看,只需简单地执行一条gcc命令就可以了;但从编译器的角度来看,却需要完成一系列非常繁杂的工作。首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。
    为了更好地理解gcc的工作过程,可以把上述编译过程分成几个步骤单独进行,并观察每步的运行结果。
    第一步要进行预编译,使用-E参数可以让gcc在预处理结束后停止编译过程:
    [david@DAVID david]$ gcc -E hello.c -o hello.i
    此时若查看hello.i文件中的内容,会发现stdio.h的内容确实都插到文件里去了,而且被预处理的宏定义也都作了相应的处理。
    # 1 "hello.c"
    # 1 "<built-in>"
    # 1 "<command line>"
    # 1 "hello.c"
    # 1 "/usr/include/stdio.h" 1 3
    # 28 "/usr/include/stdio.h" 3
    # 1 "/usr/include/features.h" 1 3
    # 291 "/usr/include/features.h" 3
    # 1 "/usr/include/sys/cdefs.h" 1 3
    # 292 "/usr/include/features.h" 2 3
    # 314 "/usr/include/features.h" 3
    # 1 "/usr/include/gnu/stubs.h" 1 3
    # 315 "/usr/include/features.h" 2 3
    # 29 "/usr/include/stdio.h" 2 3
    # 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3
    # 213 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 3
    typedef unsigned int size_t;
    # 35 "/usr/include/stdio.h" 2 3
    # 1 "/usr/include/bits/types.h" 1 3
    # 28 "/usr/include/bits/types.h" 3
    # 1 "/usr/include/bits/wordsize.h" 1 3
    # 29 "/usr/include/bits/types.h" 2 3
    # 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3
    # 32 "/usr/include/bits/types.h" 2 3
     
    "hello.i" 838L, 16453C                         1,1           Top
    下一步是将hello.i编译为目标代码,这可以通过使用-c参数来完成:
    [david@DAVID david]$ gcc -c hello.i -o hello.o
    gcc默认将.i文件看成是预处理后的C语言源代码,因此上述命令将自动跳过预处理步骤而开始执行编译过程,也可以使用-x参数让gcc从指定的步骤开始编译。最后一步是将生成的目标文件链接成可执行文件:
    [david@DAVID david]$ gcc hello.o -o hello
    在采用模块化的设计思想进行软件开发时,通常整个程序是由多个源文件组成的,相应地就形成了多个编译单元,使用gcc能够很好地管理这些编译单元。假设有一个由david.c和xueer.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序davidxueer,可以使用下面这条命令:
    [david@DAVID david]$ gcc david.c xueer.c -o davidxueer
    如果同时处理的文件不止一个,gcc仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下3条命令:
    [david@DAVID david]$ gcc david.c -o david.o
    [david@DAVID david]$ gcc xueer.c -o xueer.o
    [david@DAVID david]$ gcc david.o xueer.o -o davidxueer
    在编译一个包含许多源文件的工程时,若只用一条gcc命令来完成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含10 000行代码,如果像上面那样仅用一条gcc命令来完成编译工作,那么gcc需要将每个源文件都重新编译一遍,然后再全部链接起来。很显然,这样浪费的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这个问题,关键是要灵活运用gcc,同时还要借助像make这样的工具。关于make,将在第5章作详细的介绍。
    3.3 gcc警告提示功能
    gcc包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员尽快找到错误代码,从而写出更加专业和优美的代码。先来读读例3-2所示的程序,这段代码写得很糟糕,仔细检查一下不难挑出如下毛病:
           main函数的返回值被声明为void,但实际上应该是int;
           使用了GNU语法扩展,即使用long long来声明64位整数,仍不符合ANSI/ISO C语言标准;
           main函数在终止前没有调用return语句。
    实例3-2 bad.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­
     

    #include <stdio.h>
    void main(void)
    {
     long long int var = 1;
     printf("It is not standard C code!/n");
    }
    下面看看gcc是如何帮助程序员来发现这些错误的。当gcc在编译不符合ANSI/ISO C语言标准的源代码时,如果加上了-pedantic选项,那么使用了扩展语法的地方将产生相应的警告信息:
    [david@DAVID david]$ gcc -pedantic bad.c -o bad
    bad.c: In function 'main':
    bad.c:4: warning: ISO C89 does not support 'long long'
    bad.c:3: warning: return type of 'main' is not 'int'
    需要注意的是,-pedantic编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅用来帮助Linux程序员离这个目标越来越近。换句话说,-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些问题才有可能被gcc发现并提出警告。
    除了-pedantic之外,gcc还有一些其他编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使gcc产生尽可能多的警告信息。例如:
    [david@DAVID david]$ gcc -Wall bad.c -o bad
    bad.c:3: warning: return type of 'main' is not 'int'
    bad.c: In function 'main':
    bad.c:4: warning: unused variable 'var'
    bad.c:6:2: warning: no newline at end of file
    gcc给出的警告信息虽然从严格意义上说不能算作是错误,但很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持简洁、优美和健壮的特性。
        在处理警告方面,另一个常用的编译选项是-Werror,它要求gcc将所有的警告当成错误进行处理,这在使用自动编译工具(如make等)时非常有用。如果编译时带上-Werror选项,那么gcc会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改。只有当相应的警告信息消除时,才可能将编译过程继续朝前推进。执行情况如下:
    [david@DAVID david]$ gcc -Werror bad.c -o bad
    cc1: warnings being treated as errors
    bad.c: In function 'main':
    bad.c:3: warning: return type of 'main' is not 'int'
    bad.c:6:2: no newline at end of file
    对Linux程序员来讲,gcc给出的警告信息是很有价值的,它们不仅可以帮助程序员写出更加健壮的程序,而且还是跟踪和调试程序的有力工具。建议在用gcc编译源代码时始终带上-Wall选项,并把它逐渐培养成为一种习惯,这对找出常见的隐式编程错误很有帮助。
    3.4 库 依 赖
    在Linux下使用C语言开发应用程序时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助一个或多个函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。虽然Linux下大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下,但并不是所有的情况都是这样。正因如此,gcc在编译时必须让编译器知道如何来查找所需要的头文件和库文件。
    gcc采用搜索目录的办法来查找所需要的文件,-I选项可以向gcc的头文件搜索路径中添加新的目录。例如,如果在/home/david/include/目录下有编译时所需要的头文件,为了让gcc能够顺利地找到它们,就可以使用-I选项:
    [david@DAVID david]$ gcc david.c -I /home/david/include -o david
    同样,如果使用了不在标准位置的库文件,那么可以通过-L选项向gcc的库文件搜索路径中添加新的目录。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libdavid.so,为了让gcc能够顺利地找到它,可以使用下面的命令:
    [david@DAVID david]$ gcc david.c -L /home/david/lib –ldavid -o david
    值得详细解释一下的是-l选项,它指示gcc去连接库文件david.so。Linux下的库文件在命名时有一个约定,那就是应该以lib三个字母开头。由于所有的库文件都遵循了同样的规范,因此在用-l选项指定链接的库文件名时可以省去lib三个字母。也就是说gcc在对-l david进行处理时,会自动去链接名为libdavid.so的文件。
    Linux下的库文件分为两大类,分别是动态链接库(通常以.so结尾)和静态链接库(通常以.a结尾),两者的差别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。默认情况下,gcc在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库。如果需要的话可以在编译时加上-static选项,强制使用静态链接库。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libfoo.so和libfoo.a,为了让gcc在链接时只用到静态链接库,可以使用下面的命令:
    [david@DAVID david]$ gcc foo.c -L /home/david/lib -static –ldavid -o
    david
    3.5 gcc代码优化
    代码优化指的是编译器通过分析源代码,找出其中尚未达到最优的部分,然后对其重新进行组合,目的是改善程序的执行性能。gcc提供的代码优化功能非常强大,它通过编译选项-On来控制优化代码的生成,其中n是一个代表优化级别的整数。对于不同版本的gcc来讲,n的取值范围及其对应的优化效果可能并不完全相同,比较典型的范围是从0变化到2或3。
    编译时使用选项-O可以告诉gcc同时减小代码的长度和执行时间,其效果等价于-O1。在这一级别上能够进行的优化类型虽然取决于目标处理器,但一般都会包括线程跳转(Thread Jump)和延迟退栈(Deferred Stack Pops)两种优化。
    选项-O2告诉gcc除了完成所有-O1级别的优化之外,同时还要进行一些额外的调整工作,如处理器指令调度等。
    选项-O3则除了完成所有-O2级别的优化之外,还包括循环展开和其他一些与处理器特性相关的优化工作。
    通常来说,数字越大优化的等级越高,同时也就意味着程序的运行速度越快。许多Linux程序员都喜欢使用-O2选项,因为它在优化长度、编译时间和代码大小之间取得了一个比较理想的平衡点。
    下面通过具体实例来感受一下gcc的代码优化功能,所用程序如例3-3所示。
    实例3-3 count.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­
     

    #include <stdio.h>
     int main(void)
    { double counter;
       double result;
       double temp;
       for (counter = 0; counter < 4000.0 * 4000.0 * 4000.0 / 20.0 + 2030;   
    counter += (5 - 3 +2 + 1 ) / 4)
         { temp = counter / 1239;
            result = counter;   
           } 
                    printf("Result is %lf/n", result); 
                    return 0;
    }
    首先不加任何优化选项进行编译:
    [david@DAVID david]$ gcc -Wall count.c -o count
    借助Linux提供的time命令,可以大致统计出该程序在运行时所需要的时间:
    [david@DAVID david]$ time ./count
    Result is 3200002029.000000
    real    1m59.357s
    user    1m59.140s
    sys     0m0.050s
    接下来使用优化选项来对代码进行优化处理:
    [david@DAVID david]$ gcc -Wall count.c -o count2
    在同样的条件下再次测试一下运行时间:
    [david@DAVID david]$ time ./count2
    Result is 3200002029.000000
    real    0m26.573s
    user    0m26.540s
    sys     0m0.010s
    对比两次执行的输出结果不难看出,程序的性能的确得到了很大幅度的改善,由原来的159秒缩短到了26秒。这个例子是专门针对gcc的优化功能而设计的,因此优化前后程序的执行速度发生了很大的改变。尽管gcc的代码优化功能非常强大,但作为一名优秀的Linux程序员,首先还是要力求能够手工编写出高质量的代码。如果编写的代码简短,并且逻辑性强,编译器就不会做更多的工作,甚至根本用不着优化。
    优化虽然能够给程序带来更好的执行性能,但在如下一些场合中应该避免优化代码。
           程序开发的时候:优化等级越高,消耗在编译上的时间就越长,因此在开发的时候最好不要使用优化选项,只有到软件发行或开发结束的时候,才考虑对最终生成的代码进行优化。
           资源受限的时候:一些优化选项会增加可执行代码的体积,如果程序在运行时能够申请到的内存资源非常紧张(如一些实时嵌入式设备),那就不要对代码进行优化,因为由这带来的负面影响可能会产生非常严重的后果。
           跟踪调试的时候:在对代码进行优化的时候,某些代码可能会被删除或改写,或者为了取得更佳的性能而进行重组,从而使跟踪和调试变得异常困难。
    3.6 加   
    在将源代码变成可执行文件的过程中,需要经过许多中间步骤,包含预处理、编译、汇编和连接。这些过程实际上是由不同的程序负责完成的。大多数情况下gcc可以为Linux程序员完成所有的后台工作,自动调用相应程序进行处理。
    这样做有一个很明显的缺点,就是gcc在处理每一个源文件时,最终都需要生成好几个临时文件才能完成相应的工作,从而无形中导致处理速度变慢。例如,gcc在处理一个源文件时,可能需要一个临时文件来保存预处理的输出,一个临时文件来保存编译器的输出,一个临时文件来保存汇编器的输出,而读写这些临时文件显然需要耗费一定的时间。当软件项目变得非常庞大的时候,花费在这上面的代价可能会变得很大。
    解决的办法是,使用Linux提供的一种更加高效的通信方式——管道。它可以用来同时连接两个程序,其中一个程序的输出将直接作为另一个程序的输入,这样就可以避免使用临时文件,但编译时却需要消耗更多的内存。
    注意:
    在编译过程中使用管道是由gcc的-pipe选项决定的。下面的这条命令就是借助gcc的管道功能来提高编译速度的:
    [david@DAVID david]$ gcc -pipe david.c -o david
    在编译小型工程时使用管道,编译时间上的差异可能还不是很明显,但在源代码非常多的大型工程中,差异将变得非常明显。
    3.7 gcc常用选项
    gcc作为Linux下C/C++重要的编译环境,功能强大,编译选项繁多。为了方便大家日后编译方便,在此将常用的选项及说明罗列出来,见表3-2。
    表3-2 gcc的常用选项
    选 项 名
       
    -c
    通知gcc取消连接步骤,即编译源码并在最后生成目标文件
    -Dmacro
    定义指定的宏,使它能够通过源码中的#ifdef进行检验
    -E
    不经过编译预处理程序的输出而输送至标准输出
    -g3
    获得有关调试程序的详细信息,它不能与-o选项联合使用
    -Idirectory
    在包含文件搜索路径的起点处添加指定目录
    -llibrary
    提示连接程序在创建最终可执行文件时包含指定的库
    -O、-O2、-O3
    将优化状态打开,该选项不能与-g选项联合使用
    -S
    要求编译程序生成来自源代码的汇编程序输出
    -v
    启动所有警报
    .h
    预处理文件(标头文件)
    -Wall
    在发生警报时取消编译操作,即将警报看作是错误
    -w
    禁止所有的报警
     
    3.8 gcc的错误类型及对策
    如果gcc编译器发现源程序中有错误,就无法继续进行,也无法生成最终的可执行文件。为了便于修改,gcc给出错误信息,必须对这些错误信息逐个进行分析、处理,并修改相应的源代码,才能保证源代码的正确编译连接。.gcc给出的错误信息一般可以分为四大类,下面我们分别讨论其产生的原因和对策。
           第一类:C语法错误
    错误信息:文件source.c中第n行有语法错误(syntex errror)。这种类型的错误,一般都是C语言的语法错误,应该仔细检查源代码文件中第n行及该行之前的程序,有时也需要对该文件所包含的头文件进行检查。有些情况下,一个很简单的语法错误,gcc会给出一大堆错误,我们最主要的是要保持清醒的头脑,不要被其吓倒,必要的时候再参考一下C语言的基本教材。在这里推荐一本由Andrew Koenig写的《C 陷阱与缺陷》(此书已由人民邮电出版社翻译出版),说得夸张一点就是此书可以帮助你减少C代码和初级C++代码中的90%的bug。
           第二类:头文件错误
    错误信息:找不到头文件head.h(Can not find include file head.h)。这类错误是源代码文件中包含的头文件有问题,可能的原因有头文件名错误、指定的头文件所在目录名错误等,也可能是错误地使用了双引号和尖括号。
           第三类:档案库错误
    错误信息:连接程序找不到所需的函数库,例如:
    ld: -lm: No such file or directory
    这类错误是与目标文件相连接的函数库有错误,可能的原因是函数库名错误、指定的函数库所在目录名称错误等。检查的方法是使用find命令在可能的目录中寻找相应的函数库名,确定档案库及目录的名称并修改程序中及编译选项中的名称。
           第四类:未定义符号
    错误信息:有未定义的符号(Undefined symbol)。这类错误是在连接过程中出现的,可能有两种原因:一是用户自己定义的函数或者全局变量所在源代码文件,没有被编译、连接,或者干脆还没有定义,这需要用户根据实际情况修改源程序,给出全局变量或者函数的定义体;二是未定义的符号是一个标准的库函数,在源程序中使用了该库函数,而连接过程中还没有给定相应的函数库的名称,或者是该档案库的目录名称有问题,这时需要使用档案库维护命令ar检查我们需要的库函数到底位于哪一个函数库中,确定之后,修改gcc连接选项中的-l和-L项。
    排除编译、连接过程中的错误,应该说只是程序设计中最简单、最基本的一个步骤,可以说只是开了个头。这个过程中的错误,只是我们在使用C语言描述一个算法中所产生的错误,是比较容易排除的。我们写一个程序,到编译、连接通过为止,应该说刚刚开始,程序在运行过程中所出现的问题,是算法设计有问题,说得严重点儿是对问题的认识和理解不够,还需要更加深入地测试、调试和修改。一个程序,稍为复杂的程序,往往要经过多次的编译、连接、测试和修改。 gcc是在Linux下开发程序时必须掌握的工具之一。
    以上对gcc作了一个简要的介绍,主要讲述了如何使用gcc编译程序、产生警告信息、和加快gcc的编译速度。对所有希望早日跨入Linux开发者行列的人来说,gcc就是成为一名优秀的Linux程序员的起跑线。关于调试 C 程序的更多信息请看第4章关于gdb的内容。
     
    4 gdb
    4.1 gdb 概 述
    无论多么优秀的程序员,必须经常面对的一个问题就是调试。当程序编译完成后,他可能无法正常运行;或许程序会彻底崩溃;或许只是不能正常地运行某些功能;或许它的输出会被挂起;或许不会提示要求正常的输入。无论在何种情况下,跟踪这些问题,特别是在大的工程中,将是开发中最困难的部分,本章将介绍使用gdb(GNU debugger)调试程序的方法,该程序是一个调试器,是用来帮助程序员寻找程序中的错误的软件。
    gdb是GNU开发组织发布的一个强大的UNIX/Linux下的程序调试工具。或许,有人比较习惯图形界面方式的,像VC、BCB等IDE环境,但是在UNIX/Linux平台下做软件,gdb这个调试工具有比VC、BCB的图形化调试器更强大的功能。所谓“寸有所长,尺有所短”就是这个道理。
    一般来说,gdb主要帮忙用户完成下面4个方面的功能:
           启动程序,可以按照用户自定义的要求随心所欲的运行程序。
          可让被调试的程序在用户所指定的调试的断点处停住 (断点可以是条件表达式)
           当程序停住时,可以检查此时程序中所发生的事。
           动态地改变程序的执行环境。
    从上面来看,gdb和一般的调试工具区别不大,基本上也是完成这些功能,不过在细节上,会发现gdb这个调试工具的强大。大家可能习惯了图形化的调试工具,但有时候,命令行的调试工具却有着图形化工具所不能完成的功能。下面通过实例4-4进行说明。
    实例4-1 test.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­
     

    #include <stdio.h>
    int func(int n)
    {
         int sum=0,i;
         for(i=0; i<n; i++)
         {
            sum+=i;
           }
         return sum;
    }
     main()
    {
         int i;
         long result = 0;
         for(i=1; i<=100; i++)
          {
            result += i;
          }
         printf("result[1-100] = %d /n", result );
         printf("result[1-250] = %d /n", func(250) );
     }
    编译生成执行文件(Linux下):
    [david@DAVID david]$ gcc –g test.c -o test
    使用gdb调试:
    [david@DAVID david]$ gdb test <---------- 启动gdb
    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
    Copyright 2003 Free Software Foundation, Inc.
    gdb is free software, covered by the GNU General Public License, and you are
    welcome to change it and/or distribute copies of it under certain conditions.
    Type "show copying" to see the conditions.
    There is absolutely no warranty for gdb. Type "show warranty" for details.
    This gdb was configured as "i386-redhat-Linux-gnu"...
    (gdb)
    键入 l命令相当于list命令,从第一行开始列出源码:
    [david@DAVID david]$ gdb test
    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
    Copyright 2003 Free Software Foundation, Inc.
    gdb is free software, covered by the GNU General Public License, and you are
    welcome to change it and/or distribute copies of it under certain conditions.
    Type "show copying" to see the conditions.
    There is absolutely no warranty for gdb. Type "show warranty" for details.
    This gdb was configured as "i386-redhat-Linux-gnu"...
    (gdb) l
    7                    {
    8                           sum+=i;
    9                    }
    10                  return sum;
    11           }
    12
    13              main()
    14           {
    15                   int i;
    16                   long result = 0;
    (gdb)
    17                   for(i=1; i<=100; i++)
    18                   {
    19                           result += i;
    20                   }
    21                     printf("result[1-100] = %d /n", result );
    22                 printf("result[1-250] = %d /n", func(250) );
    23           }
    (gdb) break 16 <-------------------- 设置断点,在源程序第16行处。
    Breakpoint 1 at 0x804836a: file test.c, line 16.
    (gdb) break func <-------------------- 设置断点,在函数func()入口处。
    Breakpoint 2 at 0x804832e: file test.c, line 5.
    (gdb) info break <-------------------- 查看断点信息。
    Num Type           Disp Enb Address    What
    1   breakpoint     keep y   0x0804836a in main at test.c:16
    2   breakpoint     keep y   0x0804832e in func at test.c:5
    (gdb) r <--------------------- 运行程序,run命令简写
    Starting program: /home/david/test
     
    Breakpoint 1, main () at test.c:16 <---------- 在断点处停住。
    16                   long result = 0;
    (gdb) n <--------------------- 单条语句执行,next命令简写。
    17                   for(i=1; i<=100; i++)
    (gdb) n
    19                           result += i;
    (gdb) n
    17                   for(i=1; i<=100; i++)
    (gdb) n
    19                           result += i;
    (gdb) n
    17                   for(i=1; i<=100; i++)
    (gdb) c     <--------------------- 继续运行程序,continue命令简写。
    Continuing.
    result[1-100] = 5050  <----------程序输出。
     
    Breakpoint 2, func (n=250) at test.c:5
    5                   int sum=0,i;
    (gdb) n
    6                    for(i=0; i<n; i++)
    (gdb) p I    <--------------------- 打印变量i的值,print命令简写。
    $1 = 1107620064
    (gdb) n
    8                           sum+=i;
    (gdb) n
    6                    for(i=0; i<n; i++)
    (gdb) p sum
    $2 = 0
    (gdb) bt     <--------------------- 查看函数堆栈。
    #0 func (n=250) at test.c:6
    #1 0x080483b2 in main () at test.c:22
    #2 0x42015574 in __libc_start_main () from /lib/tls/libc.so.6
    (gdb) finish <--------------------- 退出函数。
    Run till exit from #0 func (n=250) at test.c:6
    0x080483b2 in main () at test.c:22
    22   printf("result[1-250] = %d /n", func(250) );
    Value returned is $3 = 31125
    (gdb) c <--------------------- 继续运行。
    Continuing.
    result[1-250] = 31125
     
    Program exited with code 027. <--------程序退出,调试结束。
    (gdb) q     <--------------------- 退出gdb。
    [david@DAVID david]$
    有了以上的感性认识,下面来系统地学习一下gdb。
    4.2 使 用 gdb
    gdb主要调试的是C/C++的程序。要调试C/C++的程序,首先在编译时,必须要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的 -g 参数即可。如:
    [david@DAVID david]$ gcc -g hello.c -o hello
    [david@DAVID david]$ g++ -g hello.cpp -o hello
    如果没有-g,将看不见程序的函数名和变量名,代替它们的全是运行时的内存地址。当用-g把调试信息加入,并成功编译目标代码以后,看看如何用gdb来调试。
    启动gdb的方法有以下几种:
    1. gdb <program>
    program也就是执行文件,一般在当前目录下。
    2. gdb <program> core
    用gdb同时调试一个运行程序和core文件,core是程序非法执行后,core dump后产生的文件。
    3. gdb <program> <PID>
    如果程序是一个服务程序,那么可以指定这个服务程序运行时的进程ID。gdb会自动attach上去,并调试它。program应该在PATH环境变量中搜索得到。 
    gdb启动时,可以加上一些gdb的启动开关,详细的开关可以用gdb -help查看。下面只列举一些比较常用的参数:
    -symbols <file>
    -s <file>
    从指定文件中读取符号表。
    -se file
    从指定文件中读取符号表信息,并把它用在可执行文件中。
    -core <file>
    -c <file>
    调试时core dump的core文件。
    -directory <directory>
    -d <directory>
    加入一个源文件的搜索路径。默认搜索路径是环境变量中PATH所定义的路径。
    4.2.1 gdb的命令概貌
    启动gdb后,进入gdb的调试环境中,就可以使用gdb的命令开始调试程序了。gdb的命令可以使用help命令来查看,如下所示:   
    [david@DAVID david]$ gdb
    GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
    Copyright 2003 Free Software Foundation, Inc.
    gdb is free software, covered by the GNU General Public License, and you are
    welcome to change it and/or distribute copies of it under certain conditions.
    Type "show copying" to see the conditions.
    There is absolutely no warranty for gdb. Type "show warranty" for details.
    This gdb was configured as "i386-redhat-Linux-gnu".
    (gdb) help
    List of classes of commands:
    aliases -- Aliases of other commands
    breakpoints -- Making program stop at certain points
    data -- Examining data
    files -- Specifying and examining files
    internals -- Maintenance commands
    obscure -- Obscure features
    running -- Running the program
    stack -- Examining the stack
    status -- Status inquiries
    support -- Support facilities
    tracepoints -- Tracing of program execution without stopping the program
    user-defined -- User-defined commands
     
    Type "help" followed by a class name for a list of commands in that class.
    Type "help" followed by command name for full documentation.
    Command name abbreviations are allowed if unambiguous.
    (gdb)
    gdb的命令很多,gdb将之分成许多种类。help命令只是列出gdb的命令种类,如果要看其中的命令,可以使用help <class> 命令。如:
    (gdb) help data
    Examining data.
    List of commands:
    append -- Append target code/data to a local file
    call -- Call a function in the program
    delete display -- Cancel some expressions to be displayed when program stops
    delete mem -- Delete memory region
    disable display -- Disable some expressions to be displayed when program stops
    disable mem -- Disable memory region
    disassemble -- Disassemble a specified section of memory
    display -- Print value of expression EXP each time the program stops
    dump -- Dump target code/data to a local file
    enable display -- Enable some expressions to be displayed when program stops
    enable mem -- Enable memory region
    inspect -- Same as "print" command
    mem -- Define attributes for memory region
    output -- Like "print" but don't put in value history and don't print newline
    print -- Print value of expression EXP
    printf -- Printf "printf format string"
    ptype -- Print definition of type TYPE
    restore -- Restore the contents of FILE to target memory
    set -- Evaluate expression EXP and assign result to variable VAR
    set variable -- Evaluate expression EXP and assign result to variable VAR
    undisplay -- Cancel some expressions to be displayed when program stops
    whatis -- Print data type of expression EXP
    x -- Examine memory: x/FMT ADDRESS
     
    Type "help" followed by command name for full documentation.
    Command name abbreviations are allowed if unambiguous.
    (gdb)
    也可以直接用help [command]来查看命令的帮助。
    gdb中,输入命令时,可以不用输入全部命令,只用输入命令的前几个字符就可以了。当然,命令的前几个字符应该标志着一个惟一的命令,在Linux下,可以按两次TAB键来补齐命令的全称,如果有重复的,那么gdb会把它全部列出来。
    示例一:在进入函数func时,设置一个断点。可以输入break func,或是直接输入b func。
    (gdb) b func
    Breakpoint 1 at 0x804832e: file test.c, line 5.
    (gdb)
    示例二:输入b按两次TAB键,你会看到所有b开头的命令。
    (gdb) b
    backtrace break bt
    要退出gdb时,只用输入quit或其简称q就行了。 
    4.2.2 gdb中运行Linux的shell程序
    在gdb环境中,可以执行Linux的shell命令:
    shell <command string>
    调用Linux的shell来执行<command string>,环境变量SHELL中定义的Linux的shell将会用来执行<command string>。如果SHELL没有定义,那就使用Linux的标准shell:/bin/sh(在Windows中使用Command.com或cmd.exe)。
    还有一个gdb命令是make:
    make <make-args>
    可以在gdb中执行make命令来重新build自己的程序。这个命令等价于shell make <make-args>。 
    4.2.3 在gdb中运行程序
    当以gdb <program>方式启动gdb后,gdb会在PATH路径和当前目录中搜索<program>的源文件。如要确认gdb是否读到源文件,可使用l或list命令,看看gdb是否能列出源代码。
    在gdb中,运行程序使用r或是run命令。程序的运行,有可能需要设置下面四方面的事。
    1. 程序运行参数
    set args 可指定运行时参数。如:
    set args 10 20 30 40 50
    show args 命令可以查看设置好的运行参数。
    2. 运行环境
    path <dir> 可设定程序的运行路径。
    show paths 查看程序的运行路径。
    set environment varname [=value] 设置环境变量。如:
    set env USER=hchen
    show environment [varname] 查看环境变量。
    3. 工作目录
    cd <dir> 相当于shell的cd命令。
    pwd 显示当前的所在目录。
    4. 程序的输入输出
    info terminal 显示程序用到的终端的模式。
    使用重定向控制程序输出。如:
    run > outfile
    tty命令可以指写输入输出的终端设备。如:
    tty /dev/ttyb
    4.2.4 调试已运行的程序
    调试已经运行的程序有两种方法:
           在Linux下用ps(第一章已经对ps作了介绍)查看正在运行的程序的PID(进程ID),然后用gdb <program> PID格式挂接正在运行的程序。
           先用gdb <program>关联上源代码,并进行gdb,在gdb中用attach命令来挂接进程的PID,并用detach来取消挂接的进程。
    4.2.5 暂停/恢复程序运行
    调试程序中,暂停程序运行是必需的,gdb可以方便地暂停程序的运行。可以设置程序在哪行停住,在什么条件下停住,在收到什么信号时停往等,以便于用户查看运行时的变量,以及运行时的流程。
    当进程被gdb停住时,可以使用info program 来查看程序是否在运行、进程号、被暂停的原因。
    在gdb中,有以下几种暂停方式:断点(BreakPoint)、观察点(WatchPoint)、捕捉点(CatchPoint)、信号(Signals)及线程停止(Thread Stops)。
    如果要恢复程序运行,可以使用c或是continue命令。
    1. 设置断点(BreakPoint)  
    用break命令来设置断点。有下面几种设置断点的方法:
    break <function>
    在进入指定函数时停住。C++中可以使用class::function或function(type,type)格式来指定函数名。
    break <linenum>
    在指定行号停住。
    break +offset
    break -offset
    在当前行号的前面或后面的offset行停住。offiset为自然数。
    break filename:linenum
    在源文件filename的linenum行处停住。
    break filename:function
    在源文件filename的function函数的入口处停住。
    break *address
    在程序运行的内存地址处停住。
    break
    该命令没有参数时,表示在下一条指令处停住。
    break ... if <condition>
    condition表示条件,在条件成立时停住。比如在循环体中,可以设置break if i=100,表示当i为100时停住程序。
    查看断点时,可使用info命令,如下所示(注:n表示断点号):
    info breakpoints [n]
    info break [n] 
    2. 设置观察点(WatchPoint)  
    观察点一般用来观察某个表达式(变量也是一种表达式)的值是否变化了。如果有变化,马上停住程序。有下面的几种方法来设置观察点: 
    watch <expr>
    为表达式(变量)expr设置一个观察点。一旦表达式值有变化时,马上停住程序。    
    rwatch <expr>
    当表达式(变量)expr被读时,停住程序。   
    awatch <expr>
    当表达式(变量)的值被读或被写时,停住程序。
    info watchpoints
    列出当前设置的所有观察点。
    3. 设置捕捉点(CatchPoint)
    可设置捕捉点来补捉程序运行时的一些事件。如载入共享库(动态链接库)或是C++的异常。设置捕捉点的格式为:
    catch <event>
    当event发生时,停住程序。event可以是下面的内容:
           throw 一个C++抛出的异常 (throw为关键字)。
           catch 一个C++捕捉到的异常 (catch为关键字)。
           exec 调用系统调用exec时(exec为关键字,目前此功能只在HP-UX下有用)。
           fork 调用系统调用fork时(fork为关键字,目前此功能只在HP-UX下有用)。
           vfork 调用系统调用vfork时(vfork为关键字,目前此功能只在HP-UX下有)。
           load 或 load <libname> 载入共享库(动态链接库)时 (load为关键字,目前此功能只在HP-UX下有用)。
           unload 或 unload <libname> 卸载共享库(动态链接库)时 (unload为关键字,目前此功能只在HP-UX下有用)。
    tcatch <event>
    只设置一次捕捉点,当程序停住以后,应点被自动删除。
    4. 维护停止点
    上面说了如何设置程序的停止点,gdb中的停止点也就是上述的三类。在gdb中,如果觉得已定义好的停止点没有用了,可以使用delete、clear、disable、enable这几个命令来进行维护。
    Clear
    清除所有的已定义的停止点。
    clear <function>
    clear <filename:function>
    清除所有设置在函数上的停止点。
    clear <linenum>
    clear <filename:linenum>
    清除所有设置在指定行上的停止点。
    delete [breakpoints] [range...]
    删除指定的断点,breakpoints为断点号。如果不指定断点号,则表示删除所有的断点。range 表示断点号的范围(如:3-7)。其简写命令为d。
    比删除更好的一种方法是disable停止点。disable了的停止点,gdb不会删除,当还需要时,enable即可,就好像回收站一样。
    disable [breakpoints] [range...]
    disable所指定的停止点,breakpoints为停止点号。如果什么都不指定,表示disable所有的停止点。简写命令是dis.
    enable [breakpoints] [range...]
    enable所指定的停止点,breakpoints为停止点号。
    enable [breakpoints] once range...
    enable所指定的停止点一次,当程序停止后,该停止点马上被gdb自动disable。
    enable [breakpoints] delete range...
    enable所指定的停止点一次,当程序停止后,该停止点马上被gdb自动删除。
    5. 停止条件维护
    前面在介绍设置断点时,提到过可以设置一个条件,当条件成立时,程序自动停止。这是一个非常强大的功能,这里,专门介绍这个条件的相关维护命令。
    一般来说,为断点设置一个条件,可使用if关键词,后面跟其断点条件。并且,条件设置好后,可以用condition命令来修改断点的条件(只有break和watch命令支持if,catch目前暂不支持if)。
    condition <bnum> <expression>
    修改断点号为bnum的停止条件为expression。
    condition <bnum>
    清除断点号为bnum的停止条件。
    还有一个比较特殊的维护命令ignore,可以指定程序运行时,忽略停止条件几次。
    ignore <bnum> <count>
    表示忽略断点号为bnum的停止条件count次。
    6. 为停止点设定运行命令
    可以使用gdb提供的command命令来设置停止点的运行命令。也就是说,当运行的程序在被停住时,我们可以让其自动运行一些别的命令,这很有利行自动化调试。
    commands [bnum]
    ... command-list ...
    end
    为断点号bnum指定一个命令列表。当程序被该断点停住时,gdb会依次运行命令列表中的命令。
    例如:
    break foo if x>0
    commands
    printf "x is %d/n",x
    continue
    end
    断点设置在函数foo中,断点条件是x>0,如果程序被断住后,也就是一旦x的值在foo函数中大于0,gdb会自动打印出x的值,并继续运行程序。
    如果要清除断点上的命令序列,那么只要简单地执行一下commands命令,并直接在输入end就行了。
    7. 断点菜单
    在C++中,可能会重复出现同一个名字的函数若干次(函数重载)。在这种情况下,break <function>不能告诉gdb要停在哪个函数的入口。当然,可以使用break <function(type)>,也就是把函数的参数类型告诉gdb,以指定一个函数。否则的话,gdb会列出一个断点菜单供用户选择所需要的断点。只要输入菜单列表中的编号就可以了。如:
    (gdb) b String::after
    [0] cancel
    [1] all
    [2] file:String.cc; line number:867
    [3] file:String.cc; line number:860
    [4] file:String.cc; line number:875
    [5] file:String.cc; line number:853
    [6] file:String.cc; line number:846
    [7] file:String.cc; line number:735
    > 2 4 6
    Breakpoint 1 at 0xb26c: file String.cc, line 867.
    Breakpoint 2 at 0xb344: file String.cc, line 875.
    Breakpoint 3 at 0xafcc: file String.cc, line 846.
    Multiple breakpoints were set.
    Use the "delete" command to delete unwanted
    breakpoints.
    (gdb)   
    可见,gdb列出了所有after的重载函数,选一下列表编号就行了。0表示放弃设置断点,1表示所有函数都设置断点。
    8. 恢复程序运行和单步调试
    当程序被停住后,可以用continue命令恢复程序的运行直到程序结束,或下一个断点到来。也可以使用step或next命令单步跟踪程序。
    continue [ignore-count]
    c [ignore-count]
    fg [ignore-count]
    恢复程序运行,直到程序结束,或是下一个断点到来。ignore-count表示忽略其后的断点次数。continue,c,fg三个命令都是一样的意思。
    step <count>
    单步跟踪,如果有函数调用,它会进入该函数。进入函数的前提是,此函数被编译有debug信息。很像VC等工具中的step in。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。
    next <count>
    同样单步跟踪,如果有函数调用,它不会进入该函数(很像VC等工具中的step over)。后面可以加count也可以不加,不加表示一条条地执行,加表示执行后面的count条指令,然后再停住。
    set step-mode
    set step-mode on
    打开step-mode模式。在进行单步跟踪时,程序不会因为没有debug信息而不停住。这个参数有很利于查看机器码。
    set step-mod off
    关闭step-mode模式。
    finish
    运行程序,直到当前函数完成返回。并打印函数返回时的堆栈地址和返回值及参数值等信息。
    until 或 u
    当厌倦了在一个循环体内单步跟踪时,这个命令可以运行程序直到退出循环体。
    stepi 或 si
    nexti 或 ni
    单步跟踪一条机器指令。一条程序代码有可能由数条机器指令完成,stepi和nexti可以单步执行机器指令。与之一样有相同功能的命令是display/i $pc,当运行完这个命令后,单步跟踪会在显示出程序代码的同时显示出机器指令(也就是汇编代码)。
    9. 信号(Signals)
    信号是一种软中断,是一种处理异步事件的方法。
    一般来说,操作系统都支持许多信号,尤其是Linux,比较重要的应用程序一般都会处理信号。Linux定义了许多信号,比如SIGINT表示中断字符信号,也就是Ctrl+C的信号,SIGBUS表示硬件故障的信号;SIGCHLD表示子进程状态改变信号;SIGKILL表示终止程序运行的信号等。信号量编程是UNIX下非常重要的一种技术。
    gdb有能力在调试程序的时候处理任何一种信号。可以告诉gdb需要处理哪一种信号;可以要求gdb收到所指定的信号时,马上停住正在运行的程序,以供用户进行调试。可用gdb的handle命令来完成这一功能。
    handle <signal> <keywords...>
    在gdb中定义一个信号处理。信号<signal>可以以SIG开头或不以SIG开头,可以定义一个要处理信号的范围(如:SIGIO-SIGKILL,表示处理从SIGIO信号到SIGKILL的信号,其中包括SIGIO,SIGIOT,SIGKILL三个信号),也可以使用关键字all来标明要处理所有的信号。一旦被调试的程序接收到信号,运行程序马上会被gdb停住,以供调试。其<keywords>可以是以下几种关键字中的一个或多个。
    nostop
    当被调试的程序收到信号时,gdb不会停住程序的运行,但会显示出消息告诉用户收到这种信号。
    stop
    当被调试的程序收到信号时,gdb会停住程序。
    print
    当被调试的程序收到信号时,gdb会显示出一条信息。
    noprint
    当被调试的程序收到信号时,gdb不会告诉用户收到信号的信息。
    Pass
    noignore
    当被调试的程序收到信号时,gdb不处理信号。这表示gdb会把这个信号交给被调试程序处理。
    Nopass
    ignore
    当被调试的程序收到信号时,gdb不会让被调试程序来处理这个信号。
    info signals
    info handle
    查看有哪些信号在被gdb检测。
     
     
    10. 线程(Thread Stops)
    如果程序是多线程的话,可以定义断点是否在所有的线程上,或是在某个特定的线程上。gdb很容易完成这一工作。
    break <linespec> thread <threadno>
    break <linespec> thread <threadno> if ...
    linespec指定了断点设置的源程序的行号。threadno指定了线程的ID,注意,这个ID是gdb分配的,可以通过info threads命令来查看正在运行程序中的线程信息。如果不指定thread <threadno>则表示断点设在所有线程上面。还可以为某线程指定断点条件。如:
    (gdb) break frik.c:13 thread 28 if bartab > lim
    当程序被gdb停住时,所有的运行线程都会被停住。这方便用户查看运行程序的总体情况。而在恢复程序运行时,所有的线程也会被恢复运行。那怕是主进程在被单步调试时。
    4.2.6 查看栈信息
    当程序被停住时,需要做的第一件事就是查看程序是在哪里停住的。当程序调用了一个函数时,函数的地址、函数参数、函数内的局部变量都会被压入“栈”(Stack)中。可以用gdb命令来查看当前的栈中的信息。
    下面是一些查看函数调用栈信息的gdb命令:
    backtrace
    bt
    打印当前的函数调用栈的所有信息。如:
    (gdb) bt
    #0 func (n=250) at tst.c:6
    #1 0x08048524 in main (argc=1, argv=0xbffff674) at tst.c:30
    #2 0x400409ed in __libc_start_main () from /lib/libc.so.6
    从上可以看出函数的调用栈信息:__libc_start_main --> main() --> func()   
    backtrace <n>
    bt <n>
    n是一个正整数,表示只打印栈顶上n层的栈信息。
    backtrace <-n>
    bt <-n>
    -n表示一个负整数,表示只打印栈底下n层的栈信息。     
    如果要查看某一层的信息,需要切换当前的栈。一般来说,程序停止时,最顶层的栈就是当前栈,如果要查看栈下面层的详细信息,首先要做的是切换当前栈。
    frame <n>
    f <n>
    n是一个从0开始的整数,是栈中的层编号。比如:frame 0表示栈顶,frame 1表示栈的第二层。 
    up <n>
    表示向栈的上面移动n层,可以不输入n,表示向上移动一层。
    down <n>
    表示向栈的下面移动n层,可以不输入n,表示向下移动一层。    
    上面的命令,都会输出移动到的栈层的信息。如果不想让其输出信息。可以使用这三个命令:
           select-frame <n> 对应于 frame 命令。
           up-silently <n> 对应于 up 命令。
           down-silently <n> 对应于 down 命令。
    查看当前栈层的信息,可以用以下gdb命令:
    frame 或 f
    显示出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句。
    info frame
    info f
    命令会显示出更为详细的当前栈层的信息,只不过,大多数都是运行时的内内地址。比如:函数地址,调用函数的地址,被调用函数的地址,目前函数的程序语言、函数参数地址及值、局部变量的地址等。如:
    (gdb) bt
    #0 main () at test.c:23
    #1 0x42015574 in __libc_start_main () from /lib/tls/libc.so.6
    (gdb) info f
    Stack level 0, frame at 0xbfffef48:
     eip = 0x80483c3 in main (test.c:23); saved eip 0x42015574
     called by frame at 0xbfffef68
     source language c.
     Arglist at 0xbfffef48, args:
     Locals at 0xbfffef48, Previous frame's sp in esp
     Saved registers:
     ebp at 0xbfffef48, eip at 0xbfffef4c
    (gdb)
    info args
    显示出当前函数的参数名及值。
    info locals
    显示出当前函数中所有局部变量及值。  
    info catch
    显示出当前函数中的异常处理信息。  
    4.2.7 查看源程序
    1. 显示源代码
    gdb 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上-g参数,把源程序信息编译到执行文件中,不然就看不到源程序了。当程序停下来以后,gdb会报告程序停在了程序的第几行上。可以用list命令来显示程序的源代码。下面介绍查看源代码的gdb命令。
    list <linenum>
    显示程序第linenum行的周围的源程序。
    list <function>
    显示函数名为function的函数的源程序。    
    list
    显示当前行后面的源程序。 
    list -
    显示当前行前面的源程序。
    一般是显示当前行的上5行和下5行,或者显示当前行的上2行和下8行,默认共显示10行。当然,也可以定制显示的范围。使用下面的命令可以设置一次显示源程序的行数:
    set listsize <count>
    设置一次显示源代码的行数。   
    show listsize
    查看当前listsize的设置。    
    list命令还有下面的用法:
    list <first>, <last>
    显示从first行到last行之间的源代码。
    list , <last>
    显示从当前行到last行之间的源代码。
    list +
    向后显示源代码。     
    一般来说,在list后面可以跟以下这些的参数:
           <linenum>  行号
           <+offset>  当前行号的正偏移量
           <-offset>  当前行号的负偏移量
           <filename:linenum> 哪个文件的哪一行
           <function> 函数名
           <filename:function> 哪个文件中的哪个函数
           <*address> 程序运行时的语句在内存中的地址
    2. 搜索源代码
    不仅如此,gdb还提供了源代码搜索的命令:
    forward-search <regexp>
    search <regexp>
    向前面搜索。
    reverse-search <regexp>
    全部搜索。 
    其中,<regexp>就是正则表达式,也是一个字符串的匹配模式,关于正则表达式,就不在这里讲了,请查看相关资料。
    3. 指定源文件的路径
    某些时候,用-g编译过后的执行程序中只是包括了源文件的名字,没有路径名。gdb提供了可以让用户指定源文件的路径的命令,以便gdb进行搜索。
    directory <dirname ... >
    dir <dirname ... >
    加一个源文件路径到当前路径的前面。如果要指定多个路径,在UNIX下可以使用“:”,在Windows下可以使用“;”。
    directory
    清除所有的自定义的源文件搜索路径信息。
    show directories
    显示定义了的源文件搜索路径。   
    4. 源代码的内存
    可以使用info line命令来查看源代码在内存中的地址。info line后面可以跟“行号” 、“函数名” 、“文件名:行号” 、“文件名:函数名”,这个命令会显示出所指定的源码在运行时的内存地址,如:
    ((gdb) info line test.c : func
    Line 4 of "test.c" starts at address 0x8048328 <func>
    and ends at 0x804832e <func+6>.
    还有一个命令(disassemble)可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令dump出来。如下面的示例表示查看函数func的汇编代码:
    (gdb) disassemble func
    Dump of assembler code for function func:
    0x08048328 <func+0>:    push   %ebp
    0x08048329 <func+1>:    mov    %esp,%ebp
    0x0804832b <func+3>:    sub    $0x8,%esp
    0x0804832e <func+6>:    movl   $0x0,0xfffffffc(%ebp)
    0x08048335 <func+13>:   movl   $0x0,0xfffffff8(%ebp)
    0x0804833c <func+20>:   mov    0xfffffff8(%ebp),%eax
    0x0804833f <func+23>:   cmp    0x8(%ebp),%eax
    0x08048342 <func+26>:   jl     0x8048346 <func+30>
    0x08048344 <func+28>:   jmp    0x8048355 <func+45>
    0x08048346 <func+30>:   mov    0xfffffff8(%ebp),%eax
    0x08048349 <func+33>:   lea    0xfffffffc(%ebp),%edx
    0x0804834c <func+36>:   add    %eax,(%edx)
    0x0804834e <func+38>:   lea    0xfffffff8(%ebp),%eax
    0x08048351 <func+41>:   incl   (%eax)
    0x08048353 <func+43>:   jmp    0x804833c <func+20>
    0x08048355 <func+45>:   mov    0xfffffffc(%ebp),%eax
    0x08048358 <func+48>:   leave
    0x08048359 <func+49>:   ret
    End of assembler dump.
    (gdb)
    4.2.8 查看运行时数据 
    在调试程序时,当程序被停住时,可以使用print命令(简写命令为p),或是同义命令inspect来查看当前程序的运行数据。print命令的格式是:
    print <expr>
    print /<f> <expr>
    <expr>是表达式,是所调试的程序的语言的表达式(gdb可以调试多种编程语言);<f>是输出的格式。比如,如果要把表达式按16进制的格式输出,那么就是/x。
     1. 表达式
    print和许多gdb的命令一样,可以接受一个表达式,gdb会根据当前的程序运行的数据来计算这个表达式。既然是表达式,那么就可以是当前程序运行中的常量、变量、函数等内容。可惜的是gdb不能使用在程序中所定义的宏。
    表达式的语法应该是当前所调试的语言的语法,由于C/C++是一种大众型的语言,所以,本文中的例子都是关于C/C++的。而关于用gdb调试其他语言的内容,将在后面介绍。
    在表达式中,有几种gdb所支持的操作符,它们可以用在任何一种语言中。
    @
    是一个和数组有关的操作符,在后面会有更详细的说明。    
    ::
    指定一个在文件或是一个函数中的变量。  
    {<type>} <addr>
    表示一个指向内存地址<addr>的类型为type的一个对象。       
    2. 程序变量
    在gdb中,可以随时查看以下3种变量的值:
           全局变量(所有文件可见的)
           静态全局变量(当前文件可见的)
           局部变量(当前Scope可见的)    
    如果局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量。也就是说,如果一个全局变量和一个函数中的局部变量同名时,如果当前停止点在函数中,用print显示出的变量的值会是函数中的局部变量的值。如果此时想查看全局变量的值,可以使用“::”操作符:
    file::variable
    function::variable
    可以通过这种形式指定所要查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件f2.c中的全局变量x的值:
    (gdb) p 'f2.c'::x
    当然,“::”操作符会和C++中的发生冲突,gdb能自动识别“::”是否C++的操作符,所以不必担心在调试C++程序时会出现异常。
    另外,需要注意的是,如果程序编译时开启了优化选项,那么在用gdb调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误的情况。这个是很正常的,因为优化程序会删改程序,整理程序的语句顺序,剔除一些无意义的变量等。所以在gdb调试这种程序时,运行时的指令和所编写的指令就不一样,也就会出现想象不到的结果。对付这种情况,需要在编译程序时关闭编译优化。一般来说,几乎所有的编译器都支持编译优化的开关,例如,GNU的C/C++编译器GCC,可以使用-gstabs选项来解决这个问题。关于编译器的参数,请查看编译器的使用说明文档。
    3. 数组
    有时候需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。可以使用gdb的@操作符。@的左边是第一个内存地址的值,@的右边则是想查看的内存的长度。例如,程序中有这样的语句:
    int *array = (int *) malloc (len *sizeof (int));
    于是,在gdb调试过程中,可以用如下命令显示出这个动态数组的取值:
    p *array@len
    @的左边是数组的首地址的值,也就是变量array所指向的内容,右边则是数据的长度,其保存在变量len中。其输出结果,大约是下面这个样子的:   
    (gdb) p *array@len
            $1={2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40}
    如果是静态数组的话,直接用print数组名就可以显示数组中所有数据的内容了。
    4. 输出格式
    一般来说,gdb会根据变量的类型输出变量的值。但也可以自定义gdb的输出格式。例如,想输出一个整数的十六进制或是二进制来查看这个整型变量中的位的情况。要做到这样,可以使用gdb的数据显示格式:
           x  按十六进制格式显示变量。
           d  按十进制格式显示变量。
           u  按十六进制格式显示无符号整型。
           o  按八进制格式显示变量。
           t  按二进制格式显示变量。
           a  按十六进制格式显示变量。
           c  按字符格式显示变量。
           f  按浮点数格式显示变量。
    (gdb) p i
    $21 = 101   
    (gdb) p/a i
    $22 = 0x65
    (gdb) p/c i
    $23 = 101 'e'
    (gdb) p/f i
    $24 = 1.41531145e-43
    (gdb) p/x i
    $25 = 0x65
    (gdb) p/t i
    $26 = 1100101
    5. 查看内存
    可以使用examine命令(简写是x)来查看内存地址中的值。x命令的语法如下所示:
    x/<n/f/u> <addr> 
           n、f、u是可选的参数。 
           n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。
           f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是s,如果是指令地址,那么格式可以是i。
           u 表示从当前地址往后请求的字节数,如果不指定的话,gdb默认是4个bytes。u参数可以用下面的字符来代替:b表示单字节,h表示双字节,w表示四字节,g表示八字节。当指定了字节长度后,gdb会从指定的内存地址开始,读写指定字节,并把其当作一个值取出来。
           <addr>表示一个内存地址。
    n/f/u三个参数可以一起使用。例如:
    x/3uh 0x54320
    表示从内存地址0x54320读取内容,h表示以双字节为1个单位,3表示3个单位,u表示按十六进制显示。
    6. 自动显示
    可以设置一些自动显示的变量,当程序停住时,或是在单步跟踪时,这些变量会自动显示。相关的gdb命令是display。
    display <expr>
    display/<fmt> <expr>
    display/<fmt> <addr>
    expr是一个表达式,fmt表示显示的格式,addr表示内存地址。当用display设定好了一个或多个表达式后,只要程序停下来,gdb会自动显示所设置的这些表达式的值。  
    格式i和s同样被display支持,一个非常有用的命令是: 
    display/i $pc
    $pc是gdb的环境变量,表示指令的地址,/i则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。
    下面是一些和display相关的gdb命令:
    undisplay <dnums...>
    delete display <dnums...>
    删除自动显示,dnums意为设置好了的自动显示的编号。如果要同时删除几个编号,可以用空格分隔;如果要删除一个范围内的编号,可以用减号表示(如:2-5)。
    disable display <dnums...>
    enable display <dnums...>
    disable和enalbe不删除自动显示的设置,而只是让其失效和恢复。
    info display
    查看display设置的自动显示的信息。gdb会显示出一张表格,报告调试中设置了多少个自动显示设置,其中包括设置的编号、表达式及是否enable。
    7. 设置显示选项
    gdb中关于显示的选项比较多,这里只列举大多数常用的选项。
    set print address
    set print address on
    打开地址输出,当程序显示函数信息时,gdb会显出函数的参数地址。系统默认为打开的,如:       
    (gdb) f
    #0 set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")
    at input.c:530
    530         if (lquote != def_lquote)
    set print address off
    关闭函数的参数地址显示,如:
    (gdb) set print addr off
    (gdb) f
    #0 set_quotes (lq="<<", rq=">>") at input.c:530
    530         if (lquote != def_lquote)
    show print address
    查看当前地址显示选项是否打开。  
    set print array
    set print array on
    打开数组显示。打开后当数组显示时,每个元素占一行;如果不打开的话,每个元素以逗号分隔。这个选项默认是关闭的。
    set print array off
    show print array
    set print elements <number-of-elements>
    这个选项主要是设置数组的,如果数组太大了,就可以指定一个<number-of-elements>来指定数据显示的最大长度,当达到这个长度时,gdb就不再往下显示了。如果设置为0,则表示不限制。  
    show print elements
    查看print elements的选项信息。       
    set print null-stop <on/off>
    如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为off。  
    set print pretty on
    如果打开printf pretty这个选项,那么当gdb显示结构体时会比较漂亮。如:
                                 $1 = {
                                    next = 0x0,
                                              flags = {
                                                      sweet = 1,
                                                     our = 1
                                              },
                                              meat = 0x54 "Pork"
                               }
    set print pretty off
    关闭printf pretty这个选项,gdb显示结构体时会如下显示:
    $1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}  
    show print pretty
    查看gdb是如何显示结构体的。
    set print sevenbit-strings <on/off>
    设置字符显示,是否按“/nnn”的格式显示。如果打开,则字符串或字符数据按/nnn显示,如“/065”。
    show print sevenbit-strings
    查看字符显示开关是否打开。 
    set print union <on/off>
    设置显示结构体时,是否显示其内的联合体数据。例如有以下数据结构:
                   typedef enum {Tree, Bug} Species;
                          typedef enum {Big_tree, Acorn, Seedling} Tree_forms;
                        typedef enum {Caterpillar, Cocoon, Butterfly}
                                 Bug_forms;
           
                        struct thing {
                      Species it;
                      union {
                    Tree_forms tree;
                    Bug_forms bug;
                        } form;
                        };
    struct thing foo = {Tree, {Acorn}};
    当打开这个开关时,执行 p foo 命令后,会如下显示:
    $1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}
    当关闭这个开关时,执行 p foo 命令后,会如下显示:
    $1 = {it = Tree, form = {...}}
    show print union
    查看联合体数据的显示方式。
    set print object <on/off>
    在C++中,当一个对象指针指向其派生类时,如果打开这个选项,gdb会自动按照虚方法调用的规则显示输出,如果关闭这个选项,gdb就不管虚函数表了。这个选项默认是off。
    show print object
    查看对象选项的设置。  
    set print static-members <on/off>
    这个选项表示,当显示一个C++对象中的内容时,是否显示其中的静态数据成员。默认是on。
    show print static-members
    查看静态数据成员选项设置。  
    set print vtbl <on/off>
    当此选项打开时,gdb将用比较规整的格式来显示虚函数表时。其默认是关闭的。 
    show print vtbl
    查看虚函数显示格式的选项。     
    8. 历史记录
    当用gdb的print查看程序运行时的数据时,每一个print都会被gdb记录下来。gdb会以$1, $2, $3 .....这样的方式为每一个print命令编上号。于是,可以使用这个编号访问以前的表达式,如$1。这个功能所带来的好处是,如果先前输入了一个比较长的表达式,并想查看这个表达式的值,可以使用历史记录来访问,省去了重复输入。  
    9. gdb环境变量
    可以在gdb的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。
    要定义一个gdb的变量很简单,只需使用gdb的set命令。gdb的环境变量和UNIX一样,也是以$起头。如:
    set $foo = *object_ptr 
    使用环境变量时,gdb会在第一次使用时创建这个变量,而在以后的使用中,则直接对其赋值。环境变量没有类型,可以给环境变量定义任意的类型,包括结构体和数组。
    show convenience
    该命令查看当前所设置的所有的环境变量。    
    这是一个比较强大的功能,环境变量和程序变量的交互使用将使得程序调试更为灵活便捷。例如:
    set $i = 0
    print bar[$i++]->contents
    输入这样的命令后,只用按回车键,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。   
    10. 查看寄存器
    要查看寄存器的值,很简单,可以使用如下命令:
    info registers
    查看寄存器的情况(除了浮点寄存器)。
    info all-registers
    查看所有寄存器的情况(包括浮点寄存器)。
    info registers <regname ...>
    查看所指定的寄存器的情况。
    寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址(ip),程序的当前堆栈地址(sp)等。同样可以使用print命令来访问寄存器的情况,只需要在寄存器名字前加一个$符号就可以了,如p。
    4.2.9 改变程序的执行
    一旦使用gdb挂上被调试程序,当程序运行起来后,可以根据自己的调试思路来动态地在gdb中更改当前被调试程序的运行线路或是其变量的值。这个强大的功能能够让用户更好地调试程序。比如,可以在程序的一次运行中走遍程序的所有分支。
    1. 修改变量值
    修改被调试程序运行时的变量值在gdb中很容易实现,使用gdb的print命令即可完成。如:
    (gdb) print x=4
    x=4这个表达式是C/C++的语法,意为把变量x的值修改为4,如果当前调试的语言是Pascal,那么可以使用Pascal的语法x:=4。
    在某些时候,变量很有可能和gdb中的参数冲突,如:      
    (gdb) whatis width
    type = double
    (gdb) p width
    $4 = 13
    (gdb) set width=47
    Invalid syntax in expression.
    因为,set width是gdb的命令,所以,出现了Invalid syntax in expression的设置错误。此时,可以使用set var命令来告诉gdb,width不是gdb的参数,而是程序的变量名,如:
    (gdb) set var width=47    
    另外,还可能有些情况,gdb并不报告这种错误。所以保险起见,在改变程序变量取值时,最好都使用set var格式的gdb命令。   
    2. 跳转执行
    一般来说,被调试程序会按照程序代码的运行顺序依次执行。gdb提供了乱序执行的功能,也就是说,gdb可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由gdb的jump命令来实现:
    jump <linespec>
    指定下一条语句的运行点。<linespce>可以是文件的行号,可以是file:line格式,可以是+num这种偏移量格式。表示下一条运行语句从哪里开始。
     
    jump <address>
    这里的<address>是代码行的内存地址。
    注意:
    jump命令不会改变当前的程序栈中的内容,所以,从一个函数跳到另一个函数时,当函数运行完返回进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序Core Dump。所以最好是在同一个函数中进行跳转。
    熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以,jump命令也就是改变了这个寄存器中的值。可以使用set $pc来更改跳转执行的地址。如: 
    set $pc = 0x485
    3. 产生信号量
    使用singal命令可以产生一个信号量给被调试的程序。如中断信号Ctrl+C。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用gdb产生一个信号量。精确地在某处产生信号非常有利程序的调试。
    其语法是:
    signal <singal>
    Linux的系统信号量通常从1到15。所以<singal>的取值也在这个范围。
    signal命令和shell的kill命令不同,系统的kill命令发信号给被调试程序时,是由gdb截获的,而signal命令所发出的信号则是直接发给被调试程序的。
    4. 强制函数返回
        如果调试断点在某个函数中,还有语句没有执行完,可以使用return命令强制函数忽略还没有执行的语句并返回。
    return
    return <expression>
    使用return命令取消当前函数的执行,并立即返回。如果指定了<expression>,那么该表达式的值会被当作函数的返回值。
    5. 强制调用函数
        call <expr>
    表达式中也可以是函数,以达到强制调用函数的目的,显示函数的返回值,如果函数返回值是void,那么就不显示。
    另一个相似的命令也可以完成这一功能——print。print后面可以跟表达式,所以也可以用它来调用函数。print和call的不同之处是,如果函数返回void,call则不显示,print则显示函数返回值,并把该值存入历史数据中。
    6. 在不同语言中使用gdb
    gdb支持下列语言:C、C++、Fortran、PASCAL、Java、Chill、assembly 和 Modula-2。一般来说,gdb会根据所调试的程序来确定所用的调试语言。比如:发现文件名后缀为.c的,gdb会认为是C程序;文件名后缀为.C、.cc、.cp、.cpp、.cxx、.c++的,gdb会认为是C++程序;后缀是.f, .F的,gdb会认为是Fortran程序;后缀为.s、.S的会认为是汇编语言。
    也就是说,gdb会根据所调试的程序的语言,来设置自己的语言环境,并让gdb的命令跟着语言环境的改变而改变。比如一些gdb命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如,C/C++中对指针的语法是*p,而在Modula-2中则是p^。并且,如果当前的程序是由几种不同语言一同编译成的,到调试过程中,gdb也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,确实是一种体贴开发人员的设计。
    下面是几个关于gdb语言环境的命令:
    show language
    查看当前的语言环境。如果gdb不能识别所调试的编程语言,那么,C语言被认为是默认的环境。
    info frame
    查看当前函数的程序语言。
    info source
    查看当前文件的程序语言。
    如果gdb没有检测出当前的程序语言,那么用户也可以手动设置当前的程序语言。使用set language命令即可做到。
    如果set language命令后什么也不跟,可以查看gdb所支持的语言种类:   
    (gdb) set language
    The currently understood settings are:
     
    local or auto    Automatic setting based on source file
                 Use the C language
    c++             Use the C++ language
    asm             Use the Asm language
    fortran        Use the Fortran language
    java            Use the Java language
    modula-2       Use the Modula-2 language
    pascal                  Use the Pascal language
    scheme                 Use the Scheme language
    可以在set language后加上被列出来的程序语言名,来设置当前的语言环境。
    gdb是一个强大的命令行调试工具。大家知道命令行的强大在于,其可以形成执行序列,形成脚本。Linux下的软件以命令行的较多,这给程序开发提供了极大的便利。命令行软件的优势在于,它们可以非常容易地集成在一起,使用几个简单的已有工具的命令,就可以实现一个非常强大的功能。
     因此Linux下的软件比Windows下的软件更能有机地结合,各自发挥长处,组合起来具有更为强大的功能。而Windows下的图形软件基本上是各自为营,互相不能调用,很不利于各种软件的相互集成。这里并不是要和Windows作个什么比较,所谓“寸有所长,尺有所短”,图形化工具还是有不如命令行的地方。
     
     
    5 使用 make
    make是一个解释makefile文件中的指令的命令工具。一般来说,大多数的IDE都有这个命令,比如DelphimakeVisual C++nmakeLinuxGNUmake
    什么是makefile文件?make命令执行时,需要一个 makefile文件,以告诉make命令需要怎样去编译和连接程序。或许很多Windows程序员都不知道这个工具,因为那些WindowsIDE都没有提供该功能。作一个专业的程序员尤其是作为Linux下的程序员,要进行Linux下的软件编程,理解makefile文件是必需的,因为会不会写makefile文件,直接关系到是否具备完成大型工程的能力,makefile文件关系到了整个工程的编译规则。这就好像尽管现在有很多HTML编辑器,但如果想成为一个专业网页设计师,还需要了解HTML标识的含义一样。
    一个工程中的源文件数量很多,其按类型、功能、模块分别放在若干个目录中,makefile文件定义了一系列的规则来指定哪些文件需要先编译,哪些文件需要后编译,哪些文件需要重新编译,甚至进行更复杂的操作。makefile文件就像一个Shell脚本,其中也可以执行操作系统的命令。makefile文件带来的好处是——自动化编译,一旦写好,只需要一个make命令,就可自动编译整个工程,极大地提高了软件开发的效率。
    5.1 makefile实例文件分析
    本部分将用一个示例来说明如何建立一个makefile文件,以便给大家一个感性认识。这个示例来源于GNUmake使用手册,工程中有8C文件和3个头文件,要写一个makefile文件来告诉make命令如何编译和连接这几个文件。makefile文件的操作规则是:
           如果这个工程没有编译过,所有C文件都要编译并被连接。
           如果这个工程的某几个C文件被修改,只需编译被修改的C文件,并连接目标程序。
           如果这个工程的头文件被改变了,需要编译引用了这几个头文件的C文件,并连接目标程序。
    只要makefile文件写得足够好,所有的这一切,只用一个make命令就可以完成,make命令会自动智能地根据当前文件的修改情况来确定哪些文件需要重新编译,从而自动编译所需要的文件并连接目标程序。
    在讲述这个makefile文件之前,还是先来粗略地看一看下面的代码:
    target ... : prerequisites ...
    command
    ...
    ...
    上面的代码中target是一个目标文件可以是Object文件也可以是执行文件还可以是一个标签(Label)。对于标签的特性,在5.3.5节中讲解。
    prerequisites是要生成的target所需要的文件或是目标。
    commandmake需要执行的命令(任意的Shell命令)
    这是一个文件的依赖关系,target这一个或多个的目标文件依赖于prerequisites中的文件,其生成规则定义在command中。prerequisites中如果有一个以上的文件比target文件更新的话,command所定义的命令就会执行。这就是makefile文件的规则,也就是makefile文件中最核心的内容。下面结合实例作详细说明。
    5.1.1 makemakefile文件的关系
    下面通过一个实例来讲述makemakefile文件的关系。
    实例5-1是一个完整的makefile文件,在一个工程中有3个头文件和8C文件,其中应用到了前面讲述的3个规则。
    实例5-1
     

    edit : main.o kbd.o command.o display.o /
               insert.o search.o files.o utils.o
                gcc -o edit main.o kbd.o command.o display.o /
                           insert.o search.o files.o utils.o
        main.o : main.c defs.h
                gcc -c main.c
        kbd.o : kbd.c defs.h command.h
                gcc -c kbd.c
        command.o : command.c defs.h command.h
                gcc -c command.c
        display.o : display.c defs.h buffer.h
                gcc -c display.c
        insert.o : insert.c defs.h buffer.h
                gcc -c insert.c
        search.o : search.c defs.h buffer.h
                gcc -c search.c
        files.o : files.c defs.h buffer.h command.h
                gcc -c files.c
        utils.o : utils.c defs.h
                gcc -c utils.c
        clean :
                rm edit main.o kbd.o command.o display.o /
                   insert.o search.o files.o utils.o
     
    提示:
    反斜杠/是换行符的意思。这样使makefile文件更易读。可以把这个内容保存在makefile文件makefile文件夹的文件中,然后在该目录下直接输入命令make,就可以生成执行文件edit。如果要删除执行文件和所有的中间目标文件,只要简单地执行一下make clean就可以了。
    在这个makefile文件中,目标文件(target)包含如下内容:执行文件edit和中间目标文件(*.o);依赖文件(prerequisites),即冒号后面的那些 .c 文件和 .h文件。每一个 .o文件都有一组依赖文件,而这些 .o文件又是执行文件edit的依赖文件。依赖关系的实质是说明目标文件由哪些文件生成,换言之,目标文件是哪些文件更新的结果。在定义好依赖关系后,后续的代码定义了如何生成目标文件的操作系统命令,其一定要以一个Tab键作为开头。
    提示:
    make并不管命令是怎么工作的,它只管执行所定义的命令。make会比较targets文件和prerequisites文件的修改日期,如果prerequisites文件的日期比targets文件的日期要新,或者target不存在,make就会执行后续定义的命令。另外,clean不是一个文件,它只不过是一个动作名字,有点像C语言中的lable一样,冒号后什么也没有,这样make就不会自动去找文件的依赖性,也就不会自动执行其后所定义的命令。要执行其后的命令,就要在make命令后明显地指出这个lable的名字。这样的方法非常有用,可以在一个makefile文件中定义不用的编译或是和编译无关的命令,比如程序的打包或备份等。
    在默认方式下,只输入make命令。其会做如下工作:
    make会在当前目录下找名字为“makefile文件”或“makefile文件夹”的文件。如果找到,它会找文件中的第一个目标文件(target)。在上面的例子中,它会找到edit这个文件,并把这个文件作为最终的目标文件;如果edit文件不存在,或是edit所依赖的后面的 .o 文件的修改时间要比edit这个文件新,它就会执行后面所定义的命令来生成edit文件。
    如果edit所依赖的.o文件也存在,make会在当前文件中找目标为.o文件的依赖性,如果找到,则会根据规则生成.o文件(这有点像一个堆栈的过程)。
    当然,C文件和H文件如果存在,make会生成 .o 文件,然后再用 .o 文件生成make的最终结果,也就是执行文件edit。
    这就是整个make的依赖性,make会一层又一层地去找文件的依赖关系,直到最终编译出第一个目标文件。在找寻的过程中,如果出现错误,比如最后被依赖的文件找不到,make就会直接退出,并报错。而对于所定义的命令的错误,或是编译不成功,make就不会处理。如果在make找到了依赖关系之后,冒号后面的文件不存在,make仍不工作。
    通过上述分析,可以看出像clean这样没有被第一个目标文件直接或间接关联时,它后面所定义的命令将不会被自动执行,不过,可以显式使make执行。即使用命令make clean,以此来清除所有的目标文件,并重新编译。
    在编程中,如果这个工程已被编译过了,当修改了其中一个源文件时,比如file.c,根据依赖性,目标file.o会被重新编译(也就是在这个依赖性关系后面所定义的命令),则file.o文件也是最新的,即file.o文件的修改时间要比edit要新,所以edit也会被重新连接了。而如果改变了command.hkdb.ocommand.ofiles.o都会被重新编译,并且edit会被重新连接。
    5.1.2 makefile文件中使用变量
    在上面的例子中,先通过实例5-2来看看edit的规则。
    实例5-2
     

    edit : main.o kbd.o command.o display.o /
                      insert.o search.o files.o utils.o
                gcc -o edit main.o kbd.o command.o display.o /
                           insert.o search.o files.o utils.o
    可以看到,[.o]文件的字符串被重复了两次。如果这个工程需要加入一个新的[.o]文件,需要在两个位置插入(实际是3个位置,还有一个位置在clean)。当然,这个makefile文件并不复杂,所以在两个位置加就可以了。但如果makefile文件变得复杂,就要在第3个位置插入,该位置容易被忘掉,从而会导致编译失败。所以,为了makefile文件的易维护,在makefile文件中可以使用变量。makefile文件的变量也就是一个字符串,可以理解成C语言中的宏。比如,声明一个变量objects,在makefile文件一开始可以这样定义,见实例5-3
    实例5-3
     

    objects = main.o kbd.o command.o display.o /
                  insert.o search.o files.o utils.o
    于是就可以很方便地在makefile文件中以$(objects)的方式来使用这个变量了。改良版的makefile文件就变成实例5-4的样子
    实例5-4
     

    objects = main.o kbd.o command.o display.o /
                  insert.o search.o files.o utils.o
        edit : $(objects)
                gcc -o edit $(objects)
        main.o : main.c defs.h
                gcc -c main.c
        kbd.o : kbd.c defs.h command.h
                gcc -c kbd.c
        command.o : command.c defs.h command.h
                gcc -c command.c
        display.o : display.c defs.h buffer.h
                gcc -c display.c
        insert.o : insert.c defs.h buffer.h
                gcc -c insert.c
        search.o : search.c defs.h buffer.h
                gcc -c search.c
        files.o : files.c defs.h buffer.h command.h
                gcc -c files.c
        utils.o : utils.c defs.h
                gcc -c utils.c
        clean :
                rm edit $(objects)
    如果有新的.o文件加入,只需简单地修改一下objects变量就可以了。
    5.1.3 make自动推导依赖关系
    GNUmake功能很强大,它可以自动推导文件以及文件依赖关系后面的命令,此时就没有必要在每一个[.o]文件后都写上类似的命令,因为make会自动识别,并自己推导命令。
    只要make看到一个.o文件,它就会自动把[.c]文件加在依赖关系中;如果make找到whatever.o,则whatever.c就会成为whatever.o的依赖文件。并且 gcc -c whatever.c 也会被推导出来,于是,makefile文件再也不用写得太复杂,可以简化为实例5-5
    实例5-5
     

    objects = main.o kbd.o command.o display.o /
                  insert.o search.o files.o utils.o
        edit : $(objects)
                gcc -o edit $(objects)
        main.o : defs.h
        kbd.o : defs.h command.h
        command.o : defs.h command.h
        display.o : defs.h buffer.h
        insert.o : defs.h buffer.h
        search.o : defs.h buffer.h
        files.o : defs.h buffer.h command.h
        utils.o : defs.h
        .PHONY : clean
        clean :
                rm edit $(objects) 
    这种方法也就是make隐晦规则。上面的文件内容中,.PHONY表示clean是个伪目标文件。
    5.1.4 另类风格的makefile文件
    即然make可以自动推导命令,则可以将过多的[.o][.h]进行简化,删除重复的[.h],结果如实例5-6
    实例5-6
     

    objects = main.o kbd.o command.o display.o /
                  insert.o search.o files.o utils.o
        edit : $(objects)
               gcc -o edit $(objects)
        $(objects) : defs.h
        kbd.o command.o files.o : command.h
        display.o insert.o search.o files.o : buffer.h
        .PHONY : clean
        clean :
                rm edit $(objects)
     
    注意
    这种风格让makefile文件变得很简单,但文件依赖关系就显得有点凌乱了。鱼和熊掌不可得兼,所以并不推荐这种风格,一是文件的依赖关系看不清楚,二是文件一多,要加入几个新的.o文件,那就更不清楚了。
    5.1.5 清空目标文件的规则
    每个makefile文件中都应该写一个清空目标文件(.o和执行文件)的规则,这不仅便于重新编译,也很利于保持文件的清洁。一般的风格如下:
    实例5-7
     

    clean:
                rm edit $(objects)
    更为稳健的做法是:
    实例5-8
     

    .PHONY : clean
            clean :
                    -rm edit $(objects)
    前面说过,.PHONY表示clean是一个伪目标,而在rm命令前面加了一个小减号的目的是,如果某些文件出现问题将被忽略,继续进行后面的操作。当然,clean的规则不要放在文件的开头,否则会变成make的默认目标。不成文的规矩是clean从来都放在文件的最后
    上面讲述的实例是一个makefile文件的概貌,也是编写一般makefile文件的基础。
    5.2 makefile文件概述
    makefile文件主要包含了5部分内容:显式规则、隐式规则、变量定义、文件指示和注释。
           显式规则。显式规则说明了如何生成一个或多个目标文件。这要由makefile文件的创作者指出,包括要生成的文件、文件的依赖文件、生成的命令。
           隐式规则。由于make有自动推导的功能,所以隐式的规则可以比较粗糙地简略书写makefile文件,这是由make所支持的。
           变量定义。在makefile文件中要定义一系列的变量,变量一般都是字符串,这有点儿像C语言中的宏。当makefile文件执行时,其中的变量都会扩展到相应的引用位置上。
           文件指示。其包括3个部分,一个是在一个makefile文件中引用另一个makefile文件,就像C语言中的include一样;另一个是指根据某些情况指定makefile文件中的有效部分,就像C语言中的预编译#if一样;还有就是定义一个多行的命令。
           注释。makefile文件中只有行注释,和UNIX的Shell脚本一样,其注释用“#”字符,这个就像C/C++中的“/* */”和“//”一样。如果要在makefile文件中使用“#”字符,可以用反斜框进行转义,如:“/#”。
    技巧:
    makefile文件中的命令必须要以[Tab]键开始。
    默认情况下,make命令会在当前目录下按顺序找寻文件名为GNUmakefile文件Makefile文件makefile文件的文件,找到后解释这个文件。在这3个文件名中,最好使用makefile文件这个文件名。最好不要用GNUmakefile文件,这个文件是GNUmake识别的。注意,一些makeMakefile文件文件名不敏感,但是大多数的make都支持Makefile文件makefile文件这两种默认文件名。当然,可以使用别的文件名来书写makefile文件,比如:Make.LinuxMake.SolarisMake.AIX等。如果要指定特定的makefile文件,可以使用make-f--file参数,如:make -f Make.Linux。命令如下:
    [david@DAVID david]$ make -f makelinux
    makefile文件中使用include关键字可以把别的makefile文件包含进来这类似于C语言的#include被包含的文件会保持原来状态并放在当前文件的包含位置。include的语法是:
        include <filename>
    filename可以是当前操作系统Shell的文件模式(可以保含路径和通配符)。在include前面可以有一些空字符但是绝不能以[Tab]键开始。include<filename>可以用一个或多个空格隔开。举个例子,有这样几个makefile文件:a.mkb.mkc.mk,还有一个文件叫foo.make,以及一个变量$(bar),其包含了e.mkf.mk,下面的语句:
    include foo.make *.mk $(bar)
    等价于:
    include foo.make a.mk b.mk c.mk e.mk f.mk
    make命令开始时会找寻include所指出的其他makefile文件并把其内容安置在当前的位置就好像C/C++#include指令一样。如果文件都没有指定绝对路径或相对路径,make会在当前目录下首先寻找,如果当前目录下没有找到,make还会在下面的几个目录下寻找:
           如果make执行时,有-I或--include-dir参数,make就会在这个参数所指定的目录下去寻找。
           如果目录<prefix>/include(一般是:/usr/local/bin或/usr/include)存在,make也会去找。
    如果有文件没有找到,make会生成一条警告信息,但不会马上出现致命错误。它会继续载入其他文件,一旦完成makefile文件的读取,make会再重试这些没有找到或是不能读取的文件,如果还是不行,make才会出现一条致命信息。如果想让make不理那些无法读取的文件,而继续执行,可以在include前加一个减号。如:
    -include <filename>
    这表示,无论include过程中出现什么错误,都不会报错而是继续执行。和其他版本make兼容的相关命令是sinclude,其作用和inculde相同。
    如果当前环境中定义了环境变量MAKEFILESmake会把这个变量中的值作一个类似于include的动作。这个变量中的值是其他的makefile文件,用空格分隔。只是它和include不同的是,从这个环境变量中引入的makefile文件的目标不会起作用,如果环境变量中定义的文件发现错误,make也会忽略。
    在这里建议不要使用这个环境变量,因为只要这个变量一旦被定义,当使用make时,所有的makefile文件都会受到它的影响,这绝不是希望看到的结果。此处是为了提醒大家,也许有时候makefile文件出现了问题,此时可以看看当前环境中有没有定义这个变量。
    GNUmake工作时的执行步骤如下:
    (1) 读入所有的makefile文件。
    (2) 读入被include包括的其他makefile文件。
    (3) 初始化文件中的变量。
    (4) 推导隐式规则,并分析所有规则。
    (5) 为所有的目标文件创建依赖关系链。
    (6) 根据依赖关系,决定哪些目标要重新生成。
    (7) 执行生成命令。
    (1)(5)步为第一个阶段,(6)(7)为第二个阶段。第一个阶段中,如果定义的变量被使用了,make会把其在使用的位置展开。但make并不会马上完全展开,make使用的是拖延战术,如果变量出现在依赖关系的规则中,仅当这条依赖被决定要使用了,变量才会在其内部展开。
    5.3 make书写规则
    make书写规则包含两个部分,一个是依赖关系,一个是生成目标的方法。在makefile文件中,规则的顺序是很重要的。因为makefile文件中只应该有一个最终目标,其他的目标都是被这个目标所连带出来的,所以一定要让make知道最终目标是什么。一般来说,定义在makefile文件中的目标可能会有很多,但是第一条规则中的目标将被确立为最终的目标。make所完成的也就是这个目标。
    5.3.1 规则举例
    实例5-9
     

    foo.o : foo.c defs.h       # foo模块
          gcc -c -g foo.c
    看到这个例子,应该不是很陌生了,前面也已说过,foo.o是目标,foo.cdefs.h是目标所依赖的源文件,此处可使用命令gcc -c -g foo.c (Tab键开头)。这个规则说明两件事:
           文件的依赖关系。foo.o依赖于foo.c和defs.h文件,如果foo.c和defs.h文件的日期比foo.o文件的日期新,或者foo.o不存在,则发生依赖关系。
           如果生成(或更新)foo.o文件,要用到gcc命令。
    5.3.2 在规则中使用通配符
    如果想定义一系列比较类似的文件,很自然地就想起使用通配符。make支持3种通配符:*?[...]。波浪号(~)字符在文件名中也有比较特殊的用途。如果是~/test,就表示当前用户的$HOME目录下的test目录。而~hchen/test则表示用户hchen的宿主目录下的test目录(这些都是Linux下的常识,make也支持)。而在Windows或是MS-DOS下,用户没有宿主目录,波浪号所指的目录则根据环境变量HOME而定。
    通配符代替了一系列的文件,如*.c表示后缀为c的文件。一个需要注意的是,如果文件名中有通配符,如*,可以用转义字符/,如/*来表示真实的*字符,而不是任意长度的字符串。
    下面还是先来看几个例子:
    实例5-10
     

    clean:
       rm -f *.o
    实例5-10是操作系统Shell所支持的通配符。这是在命令中的通配符。
    实例5-11
     

    print: *.c
    lpr -p $?
    touch print
    实例5-11说明了通配符也可以在规则中,目标print依赖于所有的[.c]文件。其中的$?是一个自动化变量,将会在后面作详细介绍。
    实例5-12
     

    objects = *.o
    实例5-12表示了,通配符同样可以用在变量中。makefile文件中的变量其实就是C/C++中的宏。如果要让通配符在变量中展开,也就是让objects的值成为所有[.o]的文件名的集合,可以像实例5-13这样:
    实例5-13
     

    objects := $(wildcard *.o)
    这种用法由关键字wildcard指出。
    5.3.3 文件搜寻
    在一些大的工程中,有大量的源文件,通常的做法是把这许多的源文件分类,并存放在不同的目录中。所以,当make需要去找寻文件的依赖关系时,可以在文件前加上路径,但最好的方法是把一个路径告诉make,让make自动去找。makefile文件中的特殊变量VPATH就是完成这个功能的。如果没有指明这个变量,make只会在当前的目录中去找寻依赖文件和目标文件;如果定义了这个变量,make就会在当前目录找不到的情况下,到所指定的目录中去找寻文件。
    实例5-14
    VPATH = src:../headers
    实例5-14的定义指定两个目录:src../headersmake会按照这个顺序进行搜索。目录由冒号分隔(当然,当前目录永远是最高优先搜索的位置)。另一个设置文件搜索路径的方法是使用makevpath关键字(注意,它是全小写的),这不是变量,这是一个make的关键字,而这和上面提到的那个VPATH变量很类似,但是它更为灵活。它可以指定不同的文件在不同的搜索目录中。这是一个很灵活的功能,它的使用方法有三种:
           vpath <pattern> <directories>
    为符合模式<pattern>的文件指定搜索目录<directories>
           vpath <pattern>
    清除符合模式<pattern>的文件搜索目录。
           vpath
    清除所有已被设置好了的文件搜索目录。
    vapth使用方法中的<pattern>需要包含%字符。%的意思是匹配一个以上的字符,例如,%.h表示所有以.h结尾的文件。<pattern>指定了要搜索的文件集,而<directories>则指定了<pattern>的文件集的搜索目录。例如实例5-15
    实例5-15
    vpath %.h ../headers    
    该语句表示,要求make../headers目录下搜索所有以.h结尾的文件(如果某文件在当前目录没有找到的话)。可以连续地使用vpath语句,以指定不同搜索策略。如果连续的vpath语句中出现了相同的<pattern>,或是被重复了的<pattern>make会按照vpath语句的先后顺序来执行搜索。如实例5-16
     
    实例5-16
    vpath %.c foo
    vpath %   blish
    vpath %.c bar
    其表示.c结尾的文件先在foo目录然后在blish目录最后在bar目录中进行搜索。
    实例5-17
    vpath %.c foo:bar
    vpath %   blish
    实例5-17的语句则表示.c结尾的文件先在foo目录然后在bar目录最后才在blish目录中进行搜索。
    5.3.4 伪目标
    在前面的例5-1中,提到过一个clean的目标,这是一个伪目标
    实例5-18
    clean:
    rm *.o temp
    正像前面例子中的clean一样,既然生成了许多编译文件,也应该提供一个清除它们的目标以备完整地重新编译时用(make clean来使用该目标)。因为并不生成clean这个文件,伪目标并不是一个文件,只是一个标签。由于伪目标不是文件,所以make无法生成它的依赖关系和决定它是否要执行,只有通过显式地指明这个目标才能让其生效。当然,伪目标的取名不能和文件名重名,不然其就失去了伪目标的意义了。
    为了避免和文件重名这种情况,可以使用一个特殊的标记.PHONY来显式地指明一个目标是伪目标,向make说明不管是否有这个文件,这个目标就是伪目标
    PHONY : clean
    只要有这个声明,不管是否有clean文件,要运行clean这个目标,整个过程可以这样写:
    .PHONY: clean
    clean:
         rm *.o temp
    伪目标一般没有依赖的文件,但是,也可以为伪目标指定所依赖的文件。伪目标同样可以作为默认目标,只要将其放在最前面即可。比如,如果makefile文件需要连续生成若干个可执行文件,而只想简单地输入一个make就让其执行,并且所有的目标文件都写在一个makefile文件中,可以使用伪目标这个特性,如实例5-19
    实例5-19
    all : prog1 prog2 prog3
        .PHONY : all
      prog1 : prog1.o utils.o
                gcc -o prog1 prog1.o utils.o
     prog2 : prog2.o
                gcc -o prog2 prog2.o
     prog3 : prog3.o sort.o utils.o
                gcc -o prog3 prog3.o sort.o utils.o
    makefile文件中的第1个目标会被作为其默认目标,声明了一个all的伪目标,其依赖于其他3个目标。由于伪目标的特性是总会被执行,所以其依赖的那3个目标就总不如all这个目标新。所以,其他3个目标的规则总是会被采纳,也就达到了一下子生成多个目标的目的。.PHONY : all声明了all这个目标为伪目标
    从实例5-19可以看出,目标也可以成为依赖关系。所以,伪目标同样也可成为依赖关系,如实例5-20
    实例5-20
    .PHONY: cleanall cleanobj cleandiff
        cleanall : cleanobj cleandiff
                rm program
        cleanobj :
                rm *.o
        cleandiff :
                rm *.diff
    make clean将清除所有需要被清除的文件。cleanobjcleandiff这两个伪目标有点像子程序的意思。可以输入make cleanallmake cleanobj以及make cleandiff命令来达到清除不同种类文件的目的。
    5.3.5 多目标
    makefile文件规则中的目标可以不止一个,其支持多目标。有可能多个目标同时依赖于一个文件,并且其生成的命令大体类似,于是就能把其合并起来。当然,多个目标的生成规则的执行命令是同一个,这可能会带来麻烦,不过可以使用一个自动化变量$@。这个变量表示目前规则中所有目标的集合,这样说可能很抽象,如实例5-21
     
    实例5-21
    bigoutput littleoutput : text.g
    generate text.g -$(subst output,,$@) > $@
    上述规则等价于实例5-22
    实例5-22
    bigoutput : text.g
    generate text.g -big > bigoutput
    littleoutput : text.g
    generate text.g -little > littleoutput
    其中-$(subst output$@)中的$表示执行一个makefile文件的函数函数名为subst后面的为参数。$@表示目标的集合,就像一个数组,$@依次取出目标,并执行命令。
    5.3.6 静态模式
    静态模式可以更加容易地定义多目标的规则,可以让规则变得更加灵活和有弹性。语法如下:
    实例5-23
    <targets ...>: <target-pattern>: <prereq-patterns ...>
              <commands>
              ...
           targets定义了一系列的目标文件,可以有通配符,表示目标的一个集合。
           target-pattern指明了targets的模式,也就是目标集模式。
           prereq-patterns是目标的依赖模式,它对target-pattern形成的模式再进行一次依赖目标的定义。
    如果<target-pattern>定义成%.o,表示<target>集合中都是以.o结尾的;而如果<prereq-patterns>定义成%.c,表示对<target-pattern>所形成的目标集进行二次定义。其计算方法是,取<target-pattern>模式中的%(也就是去掉了扩展符[.o]),并为其加上扩展符[.c],从而形成新的集合。
    所以,目标模式或是依赖模式中都应该有%这个字符,如果文件名中有%,可以使用反斜杠/进行转义,以标明真实的%字符。
    看一个例子:
    实例5-24
    objects = foo.o bar.o
    all: $(objects)
    $(objects): %.o: %.c
    $(gcc) -c $(CFLAGS) $< -o $@
    实例5-24指明了目标从$object中获取%.o代表所有以.o结尾的目标也就是foo.o bar.o即变量$object集合的模式而依赖模式%.c则取模式%.o%也就是foo bar并为其加上.c的后缀于是依赖目标就是foo.c bar.c。而命令中的$<$@是自动化变量,$<表示所有的依赖目标集(也就是foo.c bar.c)$@表示目标集(也就是foo.o bar.o)。于是,上面的规则展开后等价于实例5-25的规则:
    实例5-25
    foo.o : foo.c
       $(gcc) -c $(CFLAGS) foo.c -o foo.o
    bar.o : bar.c
       $(gcc) -c $(CFLAGS) bar.c -o bar.o
    试想,如果“%.o”有几百个,只要用这种很简单的“静态模式规则”就可以写完一堆规则,简化多了。“静态模式规则”的用法很灵活,如果用得好,将是一个很强大的功能。再看一个例子:
    实例5-26
     files = foo.elc bar.o lose.o
        $(filter %.o,$(files)): %.o: %.c
                $(gcc) -c $(CFLAGS) $< -o $@
        $(filter %.elc,$(files)): %.elc: %.el
                emacs -f batch-byte-compile $<
    $(filter %.o,$(files))表示调用makefile文件的filter函数过滤$filter这个例子展示了makefile文件更大的弹性。
    5.3.7  自动生成依赖性
    makefile文件中,依赖关系可能会需要包含一系列的头文件,比如,如果main.c中有一句#include "defs.h",依赖关系应该是:
    main.o : main.c defs.h
    但是,如果是一个比较大型的工程,必须清楚哪些C文件包含了哪些头文件,并且,在加入或删除头文件时,也需要小心地修改makefile文件,这是一项繁琐的工作。为了避免这种繁琐而又容易出错的工作,可以使用GCC的一个-MM的选项,即自动寻找源文件中包含的头文件,并生成一个依赖关系。例如,如果执行下面的命令:
    gcc -M main.c
    其输出是:
    main.o : main.c defs.h
    于是由编译器自动生成依赖关系,而不必再手动书写若干文件的依赖关系,并由编译器自动生成。
    编译器的这个功能如何与makefile文件联系在一起呢?因为makefile文件也要根据这些源文件重新生成,让makefile文件自已依赖于源文件。这样并不现实,不过可以用其他手段来迂回地实现这一功能。GNU组织建议把编译器为每一个源文件自动生成的依赖关系放到一个文件中,为每一个name.c的文件都生成一个name.dmakefile文件,.d文件中就存放了对应.c文件的依赖关系。
    于是,可以写出.c文件和.d文件的依赖关系,让make自动更新或生成.d文件,并把其包含在主makefile文件中,就可以自动地生成每个文件的依赖关系了。这里,给出了一个模式规则来产生.d文件:
    %.d: %.c
          @set -e; rm -f $@; /
          $(gcc) -M $(CPPFLAGS) $< > $@.
    ; /
          sed 's,/($*/)/.o[ :]*,/1.o $@ : ,g' < $@.
    > $@; /
          rm -f $@.
    这个规则的意思是所有的.d文件依赖于.c文件。rm -f $@的意思是删除所有的目标也就是.d文件。第二行的意思是,为每个依赖文件$<,也就是.c文件生成依赖文件,$@表示模式%.d文件,如果有一个C文件是name.c%就是name
    意为一个随机编号,第2行生成的文件有可能是name.d.12345,第3行使用sed命令作了一个替换,第4行就是删除临时文件。
    总之,这个模式要做的事就是在编译器生成的依赖关系中加入.d文件的依赖,即把依赖关系:
    main.o : main.c defs.h
    转成:
    main.o main.d : main.c defs.h
    于是,.d文件也会自动更新,并会自动生成。当然,在这个.d文件中加入的不只是依赖关系,生成的命令也可一并加入,让每个[.d]文件都包含一个完赖的规则。一旦完成这个工作,接下来就要把这些自动生成的规则放进主makefile文件中。可以使用makefile文件的include命令来引入别的makefile文件(前面讲过),例如:
    sources = foo.c bar.c
    include $(sources:.c=.d)
    上述语句$(sources:.c=.d)中的.c=.d的意思是作一个替换把变量$(sources)中所有[.c]的字串都替换成[.d]关于这个替换的内容在后面会有更为详细的讲述。当然,使用时应注意次序,因为include是按次序来载入文件,最先载入的[.d]文件中的目标会成为默认目标。
    5.4 使
    每条规则中的命令和操作系统Shell的命令行是一致的。make会按顺序一条一条地执行命令,每条命令必须以[Tab]键开头,除非命令紧跟在依赖规则后面的分号后。在命令行之间的空格或是空行会被忽略,但是如果该空格或空行是以Tab键开头的,make会认为其是一个空命令,除非特别指定一个其他的Shellmakefile文件中,#是注释符,很像C/C++中的//,其后的本行字符都视为注释。
    5.4.1 显示命令
    通常,make会把其要执行的命令行在命令执行前输出到屏幕上。当在命令行前用@字符时,这个命令将不被make显示出来。最具代表性的例子是,用这个功能向屏幕显示一些信息。如:
    @echo 正在编译XXX模块......
    当执行make时,会输出正在编译XXX模块……字串,但不会输出命令。如果没有@make将输出:
    echo 正在编译XXX模块......
    正在编译XXX模块......
    如果make执行时,带入make参数-n--just-print,其只是显示命令,但不会执行命令。这个功能有利于调试makefile文件,可预览书写的命令的运行顺序及结果。make参数-s--slient表示全面禁止命令的显示。
    5.4.2 执行命令
    当依赖目标新于目标时,也就是当规则的目标需要更新时,make会一条一条地执行其后的命令。需要注意的是,如果要让上一条命令的结果应用在下一条命令上,应该使用分号分隔这两条命令。比如第一条命令是cd命令,希望第二条命令在cd之后的基础上运行,就不能把这两条命令写在两行上,而应该把这两条命令写在一行上,用分号分隔。如
    示例一:
    exec:
       cd /home/hchen
         pwd
    示例二
    exec:
        cd /home/hchen; pwd
    当执行make exec第一个例子中的cd没起作用pwd会打印出当前的makefile文件目录而第二个例子中cd就起作用了pwd会打印出/home/hchen
    5.4.3 命令出错
    每当命令运行完后,make会检测每个命令的返回码。如果命令返回成功,make会执行下一条命令,当规则中所有的命令成功返回后,这个规则就算是成功完成了。如果一个规则中的某个命令出错了(命令退出码非零)make就会终止执行当前规则,这将有可能终止所有规则的执行。
    有些时候,命令的出错并不表示就是错误的。例如,mkdir命令用于建立一个目录,如果目录不存在,mkdir就成功执行,万事大吉;如果目录存在,就会出错。在使用mkdir时,不希望因mkdir出错而终止规则的运行。此时就要忽略命令的出错信息,此时可以在makefile文件中的命令行前加一个减号-(Tab键之后),则此时不管命令是否出错,都认为是成功的,如实例5-27
    实例5-27
    clean:
          -rm -f *.o
     还有一个办法是make加上-i或是--ignore-errors参数这样makefile文件中的所有命令都会忽略错误。而如果一个规则是以.IGNORE作为目标的,这个规则中的所有命令都将会忽略错误。这些是不同级别的防止命令出错的方法,可以根据自己的需要设置。
    还有需要提一下的make参数是-k或是--keep-going,这个参数的意思是,如果某规则中的命令出错了,就终止该规则的执行,但继续执行其他规则。
    5.4.4 嵌套执行make
    在一些大的工程中,会将不同模块及不同功能的源文件放在不同的目录中,可以在每个目录中都书写一个该目录的makefile文件,这有利于让makefile文件变得更加简洁,而不至于把所有的东西全部写在一个makefile文件中,这样维护makefile文件时会变得困难。这个技术对于模块编译和分段编译有非常大的好处。
    例如,有一个子目录叫subdir,这个目录下有个makefile文件,来指明这个目录下文件的编译规则。总控的makefile文件可以这样书写:
    subsystem:
       cd subdir && $(MAKE)
    其等价于
    subsystem:
       $(MAKE) -C subdir
    定义$(MAKE)宏变量是因为,也许make需要一些参数,所以定义成一个变量比较利于维护。这两个例子的意思都是先进入subdir目录,然后执行make命令。
    把这个makefile文件叫做总控makefile文件,总控makefile文件的变量可以传递到下级的makefile文件中(如果显式地声明),但是不会覆盖下层的makefile文件中所定义的变量,除非指定了-e参数。
    如果要传递变量到下级makefile文件中,可以使用这样的声明:
    export <variable ...>
    如果不想让某些变量传递到下级makefile文件中,可以这样声明:
    unexport <variable ...>
    示例一:
    export variable = value
    其等价于
    variable = value
    export variable
    等价于:
    export variable := value
    等价于:
    variable := value
    export variable
    示例二
    export variable += value
    其等价于
    variable += value
    export variable
    如果要传递所有的变量,只要一个export就行了。后面什么也不用跟,表示传递所有的变量。
    需要注意的是,有两个变量,一个是SHELL,一个是MAKEFLAGS,这两个变量不管是否进行输出,其总是要传递到下层makefile文件中。特别是MAKEFILES变量,其中包含了make的参数信息,如果执行总控makefile文件时有make参数或是在上层makefile文件中定义了这个变量,MAKEFILES变量将会是这些参数,并会传递到下层makefile文件中,这是一个系统级的环境变量。
    但是make命令中有几个参数并不往下传递,它们是-C-f-h-o-W。如果不想往下层传递参数,可以这样写:
    subsystem:
    cd subdir && $(MAKE) MAKEFLAGS=
    如果定义了环境变量MAKEFLAGS,确信其中的选项是大家都会用到的。如果其中有-t-n-q参数,将会有意想不到的结果。