Linux下C编程系列–Shell(续)

shell的输入与输出主要包括:

echo命令
read命令
cat命令
管道
tee命令
标准输入、输出和标准错误
重定向

echo [-e] [-n] string

string : 字符串,可以含 shell 变量、转义符等, 一般用双引号括起来
-e : 让 echo 解释 string 中的转义符
-n : 禁止 echo 输出后输出 NEWLINE(换行)

cat [-n][-b][-t][-e] file1 file2 …

cat 是一个简单而通用的命令,可以用它来显示文件内容,创建文件,还可以用它来显示控制字符
-n : 显示行号
-b : 显示行号(不含空行)
-t : 显示制表符
-e : 显示行结束符
创建文件:

1
2
cat file1 file2 > newfile #合并文件  
cat > newfile #输入文本,按 ctrl+d 结束输入

管道

| : 把一个命令的输出传递给另一个命令作为输入。
例:

1
ls –l | grep ^d

tee 命令

把输出的一个副本输送到标准输出,另一个副本拷贝到相应的文件中。
tee [-a] filename
-a : 追加到文件末尾
tee 命令一般与管道结合使用
例:

1
ls | tee list.out

grep:

不会对输入文件进行任何修改或影响
grep家族:grep,egrep,fgrep
形式:
grep [选项] pattern file1 file2 …

pattern:可以是正则表达式(用单引号括起来)、 或字符串(加双引号)、或一个单词。
file1 file2 … :文件名列表,作为 grep 命令的输入;grep 的输入也可以来自标准输入或管道;

可以把匹配模式写入到一个文件中,每行写一个,然后使用 -f 选项,将该匹配模式传递给 grep 命令。
grep -f patternfile file1 file2 …
常用选项:
-c 只输出匹配的行的总数
-i 不区分大小写
-h 查询多个文件时,不显示文件名
-l 查询多个文件时,只输出包含匹配模式的文件的文件名
-n 显示匹配的行及行号
-v 反向查找,即只显示不包含匹配模式的行
-s 不显示错误信息

例:

  1. 查询多个文件,可以使用通配符 “ * ”
    如:

    1
    2
    grep "math2" *.txt`  
    grep "12" *`
  2. 反向匹配

    1
    ps aux | grep "ssh" | grep –v "grep"
  3. 匹配空行

    1
    2
    grep -n '^$' datafile
    grep -v '^$' datafile > datafile2
  4. 精确匹配单词: < 和 >
    找出所有包含 以 north 开头 的单词的行

    1
    grep '<north' datafile

找出所有包含 以 west 结尾 的单词的行

1
grep 'west>' datafile

找出所有包含 north 单词的行

1
grep '<north>' datafile

  1. 递归搜索目录中的所有文件:-r

    1
    grep -r "north" datafile ~/Teaching/linux/
  2. 关于某个字符连续出现次数的匹配

    1
    2
    grep 'o{2,}' helloworld
    'o{2,4}' , 'o{2,4}' , 'lo{2,4}'

流编辑器sed

sed 是一个精简的、非交互式的编辑器,它在命令行中输入编辑命令和指定文件名,然后在屏幕上查看输出。
sed如何工作的:
sed 逐行处理文件(或输入),并将输出结果发送到屏幕。
即:sed 从输入(可以是文件或其它标准输入)中读取一行,将之拷贝到一个编辑缓冲区,按指定的 sed 编辑命令进行处理,编辑完后将其发送到屏幕上,然后把这行从编辑缓冲区中删除,读取下面一行。重复此过程直到全部处理结束。
sed 只是对文件在内存中的副本进行操作,所以 sed 不会修改输入文件的内容。sed 总是输出到标准输出,可以使用重定向将 sed 的输出保存到文件中。

三种调用方式:

  1. 在命令行中直接调用
  2. 将sed命令插入脚本文件,然后调用
  3. 将sed命令插入到脚本文件,生成sed可执行脚本,在命令行中直接键入脚本名

常见的 sed 编辑命令小结:

p 打印匹配行
s 替换命令
= 显示匹配行的行号
l 显示指定行中所有字符
d 删除匹配的行
r 读文件
a 在指定行后面追加文本
w 写文件
i 在指定行前面追加文本
n 读取指定行的下面一行
c 用新文本替换指定的行
q 退出 sed

在 sed_cmd 中可以使用 shell 变量,此时应使用 双引号。

一些 sed 行命令集:

1
2
3
4
5
6
7
8
9
10
'/north/p' #打印所有包含 north 的行
'/north/!p' #打印所有不包含 north 的行
's/.$//g' #删除以句点结尾的行中末尾的句点
's/^ *//g' #删除行首空格(命令中 ^ * 之间有两个空格)
's/ */ /g' #将连续多个空格替换为一个空格
命令中 */ #前有三个空格,后面是一个空格
'/^$/d' #删除空行
's/^.//g' #删除每行的第一个字符,同 's/.//'
's/^/%/g' #在每行的最前面添加百分号 %
'3,5s/d/D/' #把第 3 行到第 5 行中每行的 第一个 d 改成 D

awk

awk 是一种用于处理数据和生成报告的编程语言
awk 可以在命令行中进行一些简单的操作,也可以被写成脚本来处理较大的应用问题
awk 与 grep、sed 结合使用,将使 shell 编程更加容易

awk如何工作的:
awk 逐行扫描输入 ( 可以是文件或管道等 ),按给定的模式查找出匹配的行,然后对这些行执行 awk 命令指定的操作

也有类似的三种使用方式。

awk的执行过程:

  1. 如果存在 BEGIN ,awk 首先执行它指定的 actions
  2. awk 从输入中读取一行,称为一条输入记录
  3. awk 将读入的记录分割成数个字段,并将第一个字段放入变量 $1 中,第二个放入变量 $2 中,以此类推;$0 表示整条记录; 字段分隔符可以通过选项 -F 指定,否则使用缺省的分隔符。
  4. 把当前输入记录依次与每一个 awk_cmd 中 pattern 比较: 如果相匹配,就执行对应的 actions; 如果不匹配,就跳过对应的 actions,直到完成所有的 awk_cmd
  5. 当一条输入记录处理完毕后,awk 读取输入的下一行,重复上 面的处理过程,直到所有输入全部处理完毕。
  6. awk 处理完所有的输入后,若存在 END,执行相应的 actions
  7. 如果输入是文件列表,awk 将按顺序处理列表中的每个文件。

awk 中正则表达式中常用到的元字符有:

1
2
3
4
5
6
7
8
9
10
^ 只匹配行首 ( 可以看成是行首的标志 )
$ 只匹配行尾 ( 可以看成是行尾的标志 )
* 一个单字符后紧跟 *,匹配 0个或多个此字符
[ ] 匹配 [] 内的任意一个字符 ( [^] 反向匹配 )
用来屏蔽一个元字符的特殊含义
. 匹配任意单个字符
str1|str2 匹配 str1 或 str2
+ 匹配一个或多个前一字符
? 匹配零个或一个前一字符
( ) 字符组

Linux 下使用的 awk 是 gawk
操作由一条或多条语句或者命令组成,语句、命令之间用分号 “ ; ” 隔开。操作中还可以使用流程控制结构的语句

awk 命令:
print 输出列表:打印字符串、变量或表达式,输出列表中各参数之间用逗号隔开;若用空格隔开,打印时各输出之间没有空格
printf ( [格式控制符], 输出列表 ) :格式化打印,语法与 C语言中的 printf 函数类似
next:停止处理当前记录, 开始读取和处理下一条记录
nextfile:强迫 awk 停止处理当前的输入文件而处理输入文件列表中的下一个文件
exit:使 awk 停止执行而跳出。若存在 END 语句,则执行 END 指定的 actions

为了避免碰到 awk 错误,要注意以下事项:
确保整个 awk_script 用单引号括起来
确保 awk_script 内所有引号都成对出现
确保用花括号括起动作语句,用圆括号括起条件语句
如果使用字符串,要保证字符串被双引号括起来 ( 在模式中除外 )

awk 语言学起来可能有些复杂,但使用它来编写一行命令或小脚本并不太难。awk 是 shell 编程的一个重要工具。在shell 命令或编程中,可以使用 awk 强大的文本处理能力