Linux学习笔记(五):shell脚本,强大的文本处理工具awk,sed

news/2024/10/3 13:02:22 标签: linux, 学习, 笔记

Linux学习笔记(五):shell脚本,awk,sed,服务管理

1. Shell 脚本

Shell 脚本是一种使用 Shell 编写的脚本,它可以在 Linux 系统中执行各种任务。

1.1 变量

  • 声明变量: 使用 export 命令声明变量。

    export 变量名
    
  • 修改变量: 在子 Shell 中修改变量,相当于创建了一个新的变量,不会影响父 Shell 中的变量。

  • 删除变量: 使用 unset 命令删除变量。

    unset 变量名
    
  • 声明类型: 使用 declare 命令声明变量的类型。

    declare -i 变量名  # 声明整型变量
    declare -r 变量名  # 声明只读变量
    declare -x 变量名  # 声明环境变量
    

1.2 特殊变量

  • $$ 符号用于引用特殊变量。
  • $?$? 用于获取上一个命令的退出状态码。
  • $-$- 用于获取当前 Shell 的选项。
  • $#$# 用于获取传递给脚本的参数个数。
  • $$$$ 用于获取当前 Shell 的进程 ID。
  • $_$_ 用于获取前一条命令的最后一个参数。
  • ${!变量名}${!变量名} 用于获取变量的值。

1.3 间接引用

  • ${变量名}: 使用 ${变量名} 进行间接引用,可以访问变量的值。

1.4 逻辑运算符

  • ${a:-b}: 如果 a 为空,则使用 b
  • ${a:=b}: 如果 a 为空,则将 b 赋值给 a
  • ${a:?b}: 如果 a 为空,则将 b 写入标准错误并退出。
  • ${a:+b}: 如果 a 为空,则返回空字符串,否则返回 b

1.5 文件操作

在这里插入图片描述

  • 文件存在test -e 文件名
  • 文件不存在test ! -e 文件名
  • 文件可读test -r 文件名
  • 文件可写test -w 文件名
  • 文件可执行test -x 文件名
    在这里插入图片描述

1.6 数组

  • 声明数组: 使用 declare -a 命令声明数组。
declare -a 数组名
  • 访问数组元素: 使用 ${数组名[索引]} 访问数组元素。

1.7 运算

  • 算术运算: 使用 expr 命令进行算术运算。
expr 10 + 20
  • 条件运算: 使用 test 命令进行条件运算。
test $x -eq $y

2. Shell 脚本深入扩展

Shell 脚本作为一种灵活的工具,可以应用于各种场景。

在这里插入图片描述

2.1 变量与参数

  • 位置参数$1, $2, $3 等用于获取传递给脚本的参数。
  • 特殊参数$*, $@, $# 等用于处理特殊参数。
  • $*:所有参数作为一个单词。
  • $@:所有参数作为单独的单词。
  • $#:传递给脚本的参数个数。
  • 获取命令行"$@""$*" 可以获取完整的命令行。

2.2 控制流

  • if 语句: 用于条件判断。
if [ 条件 ]; then
  # 条件为真时执行的命令
fi
  • case 语句: 用于多条件匹配。
case 变量 in
  情况1)
    # 情况1对应的命令
    ;;
  情况2)
    # 情况2对应的命令
    ;;
  *)
    # 默认情况
    ;;
esac
  • for 循环: 用于循环遍历。
for 变量 in 列表; do
  # 循环体
done
  • while 循环: 用于循环直到条件为假。
while [ 条件 ]; do
  # 循环体
done

2.3 函数

  • 定义函数: 使用 function 关键字定义函数。
function 函数名() {
  # 函数体
}
  • 调用函数: 使用函数名调用函数。
函数名 [参数]

2.4 输入输出

  • 读取输入: 使用 read 命令读取用户输入。
read 变量名
  • 输出文本: 使用 echo 命令输出文本。
echo "文本内容"
  • 重定向输出: 使用 >>> 运算符将输出重定向到文件。
命令 > 文件
命令 >> 文件

2.5 脚本结构

  • 注释: 使用 # 符号添加注释。
  • 空白字符: 空白字符(空格、制表符等)用于分隔命令和参数。
  • 管道: 使用 | 运算符将一个命令的输出作为另一个命令的输入。

2.6 脚本调试

  • 打印变量值: 使用 echo 命令打印变量的值,用于调试。
  • 设置断点: 使用 set -x 命令开启调试模式,打印每条命令及其参数。

2.7 Shell 类型

  • Bash: 最常用的 Shell,功能强大,易于学习和使用。
  • Zsh: 功能丰富的 Shell,支持语法高亮、别名等功能。
  • Ksh: 类似于 Bash,但有一些不同的特性。

3. 强大的文本处理工具awk

awk 是一种强大的文本处理工具,它可以将文本文件视为由记录和字段组成的数据流,并允许用户对数据进行复杂的操作。

在这里插入图片描述

3.1 基本概念

  • 记录(Record): 每一行文本都是一个记录。记录通常由换行符分隔。
  • 字段(Field): 每个记录由多个字段组成,字段通常由空白字符(空格、制表符等)分隔。
  • 字段分隔符(FS): 默认的字段分隔符是空白字符,可以使用 -F 选项指定其他分隔符,例如 -F, 使用逗号作为分隔符。
  • 模式匹配(Pattern)awk 可以根据模式匹配特定的记录。
  • 动作(Action): 对匹配的记录执行的动作,通常涉及输出或修改数据。

3.2 语法

awk [选项] '模式 {动作}' 文件...
  • 选项: 用于指定 awk 的行为,例如 -F 指定字段分隔符。
  • 模式: 用于匹配记录,可以是正则表达式或比较操作符。
  • 动作: 对匹配的记录执行的操作,可以是输出、打印、修改等。

3.3 基本用法

在这里插入图片描述
在这里插入图片描述

  • 打印所有记录
awk '{print}' 文件
  • 打印第 1 列
awk -F '\t' '{print $1}' 文件
  • 打印第二列大于 10 的记录
awk -F '\t' '$2 > 10 {print}' 文件
  • 计算所有记录的总和
awk -F '\t' '{sum += $2} END {print sum}' 文件
  • 打印包含特定单词的记录
awk '/特定单词/ {print}' 文件

3.4 高级用法

  • 嵌套模式: 可以使用多个模式进行嵌套匹配。
  • 循环和条件语句awk 支持循环和条件语句,可以执行更复杂的操作。
  • 内置函数awk 提供了大量的内置函数,例如 length(), sqrt(), strftime() 等。
  • 用户定义函数: 可以编写自己的函数,并将其添加到 awk 脚本中。

4. awk扩展用法与高级特性

4.1 复杂模式匹配

awk 支持正则表达式,这使得模式匹配更加灵活。可以使用 ~!~ 运算符来分别匹配和排除正则表达式。

# 打印包含特定模式的记录
awk '$1 ~ /模式/ {print}' 文件

# 打印不包含特定模式的记录
awk '$1 !~ /模式/ {print}' 文件

4.2 字段引用

awk 提供了多种字段引用方式,包括直接引用 $1, $2, $3 等,以及使用 NF(字段总数)、$0(整个记录)和 NR(记录数)等特殊变量。

# 打印所有记录的第三列
awk '{print $3}' 文件

# 打印每条记录的行号和所有字段
awk '{print NR, $0}' 文件

4.3 数组和关联数组

awk 支持数组和关联数组,可以用来存储和操作复杂的数据结构。

# 初始化一个关联数组
awk '{
    a[$1]++
} END {
    for (key in a) print key, a[key]
}' 文件

4.4 流控制语句

awk 支持循环和条件语句,如 for, while, if 等。

# 使用 for 循环遍历数组
awk 'BEGIN {
    for (i = 1; i <= 10; i++) print i
}'

# 使用 if 语句进行条件判断
awk '{if ($1 > 5) print $0}' 文件

4.5 内置变量和函数

awk 提供了大量的内置变量和函数,可以用于字符串操作、数学运算、日期处理等。

# 使用内置函数 split
awk -F ',' '{split($0,a," "); print a[1]}' 文件

# 使用内置变量 RS 和 RS
awk -v RS='-' '{print}' 文件

4.6 用户定义变量和函数

可以在 awk 脚本中定义自己的变量和函数。

awk '
    # 定义用户变量
    var = 10

    # 定义用户函数
    add(a, b) { return a + b }

    {
        # 使用用户变量和函数
        print var
        print add($1, $2)
    }
' 文件

4.7 处理二进制数据

awk 可以处理二进制文件,使用 -b 选项。

awk -b '{print $0}' 二进制文件

4.8 嵌套 awk 脚本

可以使用一个 awk 脚本作为另一个 awk 脚本的输入。

awk '{
    # 处理第一行
    print $0 > "output1"
    # 处理第二行
    print $0 >> "output1"
}' 文件 | awk '{
    # 处理输出文件
    print $0
}'

5. awk在shell脚本中的使用

awk 在 shell 脚本中是非常有用的,因为它可以用于处理和转换文本数据,这在脚本编写中是非常常见的任务。

5.1 简单文本处理

在 shell 脚本中,可以使用 awk 来执行简单的文本处理任务,比如打印文件的每一行。

#!/bin/bash

# 打印文件中的每一行
awk '{print}' filename

# 将输出重定向到另一个文件
awk '{print}' filename > output.txt

5.2 字段提取

awk 可以用来提取文本文件的特定列。

#!/bin/bash

# 提取第一列
awk -F, '{print $1}' filename

# 使用自定义字段分隔符
awk -F; '{print $2, $3}' filename

5.3 数据过滤

使用 awk 可以根据条件过滤数据。

#!/bin/bash

# 打印第二列大于 10 的行
awk -F, '$2 > 10' filename

# 打印包含特定单词的行
awk '/特定单词/ {print}' filename

5.4 数据计算

awk 可以用来对数据进行数学计算。

#!/bin/bash

# 计算所有记录的第二列总和
awk -F, '{sum += $2} END {print sum}' filename

# 计算平均值
awk -F, '{total += $2; count++} END {print total / count}' filename

5.5 数据排序

awk 可以用来对数据进行排序。

#!/bin/bash

# 按第二列排序
awk -F, '{print $2, $0}' filename | sort -n | awk '{print $2, $0}'

# 按第一列逆序排序
awk -F, '{print $1, $0}' filename | sort -nr | awk '{print $1, $0}'

5.6 数据转换

awk 可以用来转换数据格式。

#!/bin/bash

# 将 CSV 转换为 JSON
awk -F, '{printf "{\"%s\": \"%s\"}\n", $1, $2}' filename > output.json

5.7 复杂数据处理

在更复杂的脚本中,awk 可以嵌入在循环或条件语句中,进行更复杂的数据处理。

#!/bin/bash

# 循环遍历文件并处理每一行
while IFS= read -r line; do
    # 使用 awk 处理每一行
    awk '{print $1, $2}' <<< "$line"
done < filename

5.8 作为子shell

在 shell 脚本中,可以将 awk 命令放在子shell中执行,以避免在后台执行。

#!/bin/bash

awk '{print}' filename &
wait

注意事项

  • 当在 shell 脚本中使用 awk 时,确保文件名和变量名没有特殊字符,或者使用引号将其引起来,以避免解析错误。
  • 使用 IFS(内部字段分隔符)可以改变字段分隔符,这在处理包含空格的文件名时非常有用。
  • 在处理大量数据时,awk 可能会消耗大量内存,特别是在进行复杂的数据处理时。

6. 强大的文本处理工具sed

sed(Stream Editor)是一个强大的文本处理工具,它允许用户对文本进行编辑、转换、过滤等操作,而不需要直接对原始文件进行修改。sed 处理的是文本流,通常来自文件或标准输入(stdin)。

6.1 基本概念

  • 流编辑sed 是一个流编辑器,它一次处理一行文本。
  • 命令行编辑sed 可以在命令行上直接编辑文本,也可以从文件中读取文本。
  • 模式匹配sed 可以基于模式来选择文本行进行操作。
  • 替换sed 的主要功能之一是替换文本。

6.2 语法

sed [选项] [命令] [输入文件]
  • 选项:用于指定 sed 的行为,例如 -n 用于抑制默认的自动打印。
  • 命令:用于指定对文本进行的操作,如 p(打印)、s(替换)等。
  • 输入文件:指定输入文件名,也可以是 -' 来表示从标准输入读取。

6.3 基本用法

  • 打印匹配模式的行
sed -n '/模式/p' 文件
  • 替换文本
sed 's/旧文本/新文本/g' 文件

这里,s 是替换命令,/旧文本/ 是被查找的模式,/新文本/ 是要替换的文本,g 是全局替换标志。

6.4 高级用法

  • 删除行
sed '/模式/d' 文件

这里,d 是删除命令。

  • 添加行
sed '/模式/i 添加的文本' 文件

这里,i 是插入命令。

  • 替换并打印
sed '/模式/s/旧文本/新文本/g' 文件

这里,p 命令会打印替换后的行。

注意事项

  • sed 的替换操作默认只替换每行的第一个匹配项。要替换所有匹配项,需要使用全局替换标志 g
  • sed 的模式匹配是按行进行的,如果模式包含换行符,需要特别处理。
  • sed 的命令可以链式组合,形成复杂的文本处理流程。

7. sed的扩展用法与高级特性

7.1 使用地址范围

sed 允许你指定地址范围,这意味着你可以对文本中的特定行或行范围进行操作。

  • 指定单行
sed '3p' 文件  # 打印第三行
  • 指定多行范围
sed '1,3p' 文件  # 打印第一行到第三行
  • 反向指定
sed '3,$p' 文件  # 打印第三行到文件末尾

7.2 使用正则表达式

sed 支持复杂的正则表达式,这使得模式匹配更加灵活。

  • 使用正则表达式进行匹配
sed '/[0-9]\+/p' 文件  # 打印包含一个或多个数字的行
  • 使用括号分组
sed 's/\([0-9]\+\)/\1 square/s' 文件  # 将数字替换为其平方

7.3 使用宏和函数

sed 允许你定义宏和函数,这使得你可以重用代码。

  • 定义宏
sed -E '/pattern/{x;N;G;}' 文件  # 使用宏处理多行文本
  • 使用函数
sed -E '{
    s/\([0-9]+\)/\1*2/;  # 定义一个简单的函数
    p;
}' 文件

7.4 使用管道和重定向

sed 可以与其他命令结合使用,通过管道(|)和重定向(>)进行更复杂的文本处理。

  • 使用管道
cat 文件 | sed 's/old/new/g'  # 将 cat 命令的输出通过 sed 处理
  • 使用重定向
sed 's/old/new/g' 文件 > 新文件  # 将 sed 的输出重定向到新文件

7.5 使用 sed 进行文本转换

sed 可以用来进行各种文本转换,如转换行结束符、替换字符等。

  • 转换行结束符
sed 's/\r$//' 文件  # 将 Windows 行结束符 (\r\n) 转换为 Unix 行结束符 (\n)
  • 替换字符
sed 's/字符1/字符2/g' 文件

7.6 使用 sed 进行批量操作

sed 可以用于批量操作,比如同时替换多个模式。

sed -E '{
    s/模式1/替换文本1/g;
    s/模式2/替换文本2/g;
    p;
}' 文件

8. sed在shell脚本的使用

在shell脚本中使用sed可以极大地提高脚本处理文本数据的能力。

8.1 替换文本

在脚本中,可以使用sed来替换文件中的文本。

#!/bin/bash

# 替换文件中所有的'old'为'new'
sed -i 's/old/new/g' filename

这里,-i选项表示直接修改文件,s/old/new/g是替换命令,表示替换所有出现的’old’为’new’。

8.2 条件替换

有时候你可能只想替换符合特定条件的文本。

#!/bin/bash

# 只替换第一行中出现的'old'为'new'
sed -i '1s/old/new/g' filename

8.3 复合命令

在脚本中,你可以将多个sed命令组合起来。

#!/bin/bash

# 先替换文本,然后打印结果
sed -n 's/old/new/gp' filename

这里,-n抑制了默认的自动打印,p命令用来打印匹配的行。

8.4 过滤输出

使用sed过滤不需要的输出。

#!/bin/bash

# 仅打印包含特定模式的行
sed -n '/pattern/p' filename

8.5 文本提取

从文本中提取特定信息。

#!/bin/bash

# 提取第一列数据
sed -n 's/[^,]*,\([^\n]*\)/\1/p' filename

8.6 删除行

删除文件中的特定行。

#!/bin/bash

# 删除包含特定模式的行
sed -i '/pattern/d' filename

8.7 增加行

在文件的特定位置增加行。

#!/bin/bash

# 在第一行后增加新行
sed -i '1i\New line' filename

8.8 文件替换

在脚本中替换多个文件中的文本。

#!/bin/bash

# 替换所有文件中的'old'为'new'
for file in *.txt; do
    sed -i 's/old/new/g' "$file"
done

注意事项

  • 使用-i选项时,sed会直接修改文件。如果你不确定替换结果,可以先使用sed的输出功能来查看将要进行的修改。
  • 在使用sed进行替换时,注意转义字符的使用。例如,如果文本中包含斜杠/,你需要用双斜杠//来转义。
  • 如果你的模式或替换文本包含空格,确保它们被引号包围,以避免shell解释错误。

http://www.niftyadmin.cn/n/5688428.html

相关文章

【SQL】DDL语句

文章目录 1.SQL通用语法2.SQL的分类3.DDL3.1数据库操作3.2 表操作3.2.1 表操作--数据类型3.2.2 表操作--修改3.2.3 表操作--删除 SQL 全称 Structured Query Language&#xff0c;结构化查询语言。操作关系型数据库的编程语言&#xff0c;定义了一套操作关系型数据库统一标准 。…

第 30 章 XML

第 30 章 XML 1.IE 中的 XML 2.DOM2 中的 XML 3.跨浏览器处理 XML 随着互联网的发展&#xff0c;Web 应用程序的丰富&#xff0c;开发人员越来越希望能够使用客户端来操作 XML 技术。而 XML 技术一度成为存储和传输结构化数据的标准。所以&#xff0c;本章就详细探讨一下 Ja…

CleverPDF是一款专业的pdf转换器-强大的PDF表格识别能够将PDF中的表格提取到Excel或者其他格式-供大家学习研究参考

提供了更多的输出选项来满足您不同的PDF转换需求&#xff0c;强大的PDF表格识别能够帮助您准确地将PDF中的表格提取到Excel或者其他格式。另外CleverPDF无需上传文件到互联网&#xff0c;直接在您的本地电脑处理PDF&#xff0c;让您更放心地转换或编辑隐私或者保密的文档&#…

SPARK调优:AQE特性(含脑图总结)

学完AQE需要能够回答如下的几个问题&#xff1a; 什么是AQE&#xff1f;AQE的实现原理是什么&#xff1f;AQE的特性有哪些&#xff1f;使用什么参数实现&#xff1f;AQE每个特性可以解决什么问题&#xff1f;什么问题是AQE不能解决的 HL&#xff1a;学习脑图如下 SparkAQE是spa…

2024年9月30日--10月6日(ue5肉鸽结束)

按照月计划&#xff0c;本周把ue肉鸽游戏完成&#xff0c;然后进行ue5太阳系 &#xff0c; 剩余14节&#xff0c;218分钟&#xff0c;如果按照10分钟的视频教程1小时进行完的话&#xff0c;则需要22小时&#xff0c;分布在10月2日-10月6日之间&#xff0c;每天44分钟的视频教程…

在 Windows 环境中配置 virtualenvwrapper

在 Windows 环境中配置 virtualenvwrapper 需要使用 virtualenvwrapper-win。以下是具体步骤&#xff1a; 安装步骤 安装 Python 确保你已经安装了 Python&#xff0c;并且 python 和 pip 已添加到系统的 PATH 中。 安装 virtualenv 和 virtualenvwrapper-win 使用以下命令安…

使用 Python 实现图形学的流体模拟算法

目录 使用 Python 实现图形学的流体模拟算法引言1. 流体模拟概述1.1 定义1.2 工作原理1.3 优势 2. Python 实现流体模拟2.1 基础类向量类流体状态类流体体积类流体模拟器类 2.2 示例程序 3. 流体模拟的优缺点3.1 优点3.2 缺点 4. 改进方向5. 应用场景结论 使用 Python 实现图形…

【C++】树形结构的关联式容器:set、map、multiset、multimap的使用

&#x1f33b;个人主页&#xff1a;路飞雪吖~ ✨专栏&#xff1a;C/C 目录 一、set的简单介绍和使用 &#x1f31f;set的介绍 &#x1f525;注意&#xff1a; &#x1f320;小贴士&#xff1a; &#x1f31f;set的使用 ✨set的构造 ✨set的迭代器 ​编辑 ✨set的容量 …