文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>[转2]GAWK 入门:AWK 语言基础

[转2]GAWK 入门:AWK 语言基础

时间:2008-08-03  来源:sobigapple

利用 GAWK 的开放源代码实现学习 AWK

第 3 页,共 10 页


对本教程的评价

帮助我们改进这些内容


了解记录、字段和规则

了解 AWK 编程语言的基础知识:记录、字段和规则。

AWK 输入文件的组成部分

AWK 针对文本输入进行操作,而该文本可以是一个文件或标准输入流,它对文本进行分类以得到记录和字段。AWK 记录 是单个的、连续长度的输入数据,是 AWK 的操作对象。记录由记录分隔符 限定,记录分隔符是一个字符串,并且定义为 RS 变量(请参见更改记录分隔符部分)。在缺省情况下,RS 的值设置为换行符,所以 AWK 的缺省行为是将整行输入作为记录。

连续地读取记录,直到到达输入的末尾。图 1 显示了如何将输入数据分解为记录。


图 1. 将 AWK 输入数据划分为记录

还可以将每个记录进一步分解为称作字段 的单独的块。与记录一样,字段也受到限定。缺省的字段分隔符 是任意数量的空白字符,包括制表符和空格字符。所以在缺省情况下,将输入行进一步分解为单独的单词(由空白字符分隔的任何字符组)。

您可以通过字段编号来引用记录中的字段,从 1 开始。您可以使用字段编号或特殊的变量 NF 来调用每个记录中的最后一个字段,该变量包含当前记录中字段的个数。

您可以通过字段编号 0 来引用整个记录,包括所有的字段和字段分隔符。图 2 显示了这样一个字段的内容,即将 AWK 输入数据的单个记录分解为复合字段。


图 2. AWK 记录中的字段

注意:AWK 提供了许多方式将字段中的组成部分划分为其字符组成部分,但这超出了本教程的讨论范围。





回页首


了解规则

AWK 程序由规则 组成,它们是一些模式,后面跟着由换行分隔的操作。当 AWK 执行一条规则时,它在输入记录中搜索给定模式的匹配项,然后对这些记录执行给定的操作:

/pattern/ { action } 

您可以在规则中省略模式或操作。

操作由 AWK 语句组成,使用分号 (;) 来进行分隔。您还可以在同一行内容中提供多个规则,但是您必须使用分号对它们进行分隔。当规则中仅包含一项操作时,将对输入中的每条记录执行该操作。当规则中仅包含一个模式时,将打印出匹配该模式的所有记录。

空模式 // 匹配空字符,这等价于规则中不包含任何模式。然而,当给定空操作 {} 时,这并不等价于没有任何操作。空操作表示不进行任何操作(因此,不打印出该记录)。

打印输入中的每个记录

您可以编写一条规则,以不同的方式打印出输入中的每个记录,最简单的方法如下所示:

// 

这等价于:

{ print } 

正规的方法是:

// { print } 

这可能是 AWK 中最简单的程序。尽管它没有完成任何惊人的操作,但使用并不比这大多少的程序,就可以执行非常复杂的操作。

使用 BEGIN 和 END 模式

AWK 包含两种特殊的模式:BEGIN 和 END。它们都不需要使用斜线。BEGIN 模式指定了在处理任何记录之前需要执行的操作:

BEGIN {action} 

END 模式指定在处理了所有记录之后需要执行的操作:

END {action} 

BEGIN 通常用来设置变量,而 END 通常用来对从输入记录中读取的数据和图表进行制表、汇总和处理。通常,这些模式可以用来在输出经过处理的文本之前和之后输出文本。

例如,您可以在程序开始和结束之前输出一些消息,如清单 3 中的 AWK 程序所示。


清单 3. 带 BEGIN 和 END 模式的程序
 # Program to print a file with a header and footer. BEGIN { print "Beginning of file"; print "-----------------" } // # Print every line in the file. END { print "------------"; print "End of file."} 

请注意,这些语句由分号分隔,并且该程序的注释以井号开头。

一些基本的操作

通常,您可以使用 AWK 语言语句来构建操作,如清单 3 中的 print 语句。表 1 列出了操作中的一些最常用的 GAWK 语句和函数,并对它们的含义进行了描述。对于 C 编程人员,请注意 C 语言的语句和函数与 AWK 对等部分之间的相似之处。


表 1. 常用的 GAWK 语句
语句 描述
exit 停止程序的执行,并且退出。
next 停止处理当前记录,并且前进到下一条记录。
nextfile 停止处理当前文件,并且前进到下一个文件。
print 打印使用引号括起来的文本、记录、字段和变量。(缺省情况下是打印出当前整行记录。)
printf 打印格式化文本,类似于它的 C 语言对等成分,但必须指定结尾的换行。
sprintf 返回格式化文本字符串,与 printf 使用相同的格式。
相关阅读 更多 +
排行榜 更多 +
辰域智控app

辰域智控app

系统工具 下载
网医联盟app

网医联盟app

运动健身 下载
汇丰汇选App

汇丰汇选App

金融理财 下载