中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

shell腳本中文本處理工具的介紹和使用

發布時間:2020-05-29 09:52:08 來源:億速云 閱讀:258 作者:Leah 欄目:系統運維

這篇文章為大家帶來有關shell腳本中文本處理工具使用的詳細介紹。大部分工具可能大家會經常用到,為此分享給大家做個詳細的總結,希望你們能深刻了解shell文本處理工具的用法。

1. grep工具

grep是行過濾工具;用于根據關鍵字進行行過濾

語法和選項

語法:

# grep [選項] '關鍵字' 文件名

常見選項:

OPTIONS:
    -i: 不區分大小寫
    -v: 查找不包含指定內容的行,反向選擇
    -w: 按單詞搜索
    -o: 打印匹配關鍵字
    -c: 統計匹配到的行數
    -n: 顯示行號
    -r: 逐層遍歷目錄查找
    -A: 顯示匹配行及后面多少行 
    -B: 顯示匹配行及前面多少行
    -C: 顯示匹配行前后多少行
    -l:只列出匹配的文件名
    -L:列出不匹配的文件名
    -e: 使用正則匹配
    -E:使用擴展正則匹配
    ^key:以關鍵字開頭
    key$:以關鍵字結尾
    ^$:匹配空行
    --color=auto :可以將找到的關鍵詞部分加上顏色的顯示

顏色顯示(別名設置):

臨時設置:
# alias grep='grep --color=auto'            //只針對當前終端和當前用戶生效

永久設置:
1)全局(針對所有用戶生效)
vim /etc/bashrc
alias grep='grep --color=auto'
source /etc/bashrc

2)局部(針對具體的某個用戶)
vim ~/.bashrc
alias grep='grep --color=auto'
source ~/.bashrc

舉例說明:

==說明:不要直接使用/etc/passwd文件,將其拷貝到/tmp下做實驗!==

# grep -i root passwd                       忽略大小寫匹配包含root的行
# grep -w ftp passwd                        精確匹配ftp單詞
# grep -w hello passwd                      精確匹配hello單詞;自己添加包含hello的行到文件
# grep -wo ftp passwd                       打印匹配到的關鍵字ftp
# grep -n root passwd                       打印匹配到root關鍵字的行好
# grep -ni root passwd                      忽略大小寫匹配統計包含關鍵字root的行
# grep -nic root passwd                     忽略大小寫匹配統計包含關鍵字root的行數
# grep -i ^root passwd                      忽略大小寫匹配以root開頭的行
# grep bash$ passwd                             匹配以bash結尾的行
# grep -n ^$ passwd                             匹配空行并打印行號
# grep ^# /etc/vsftpd/vsftpd.conf       匹配以#號開頭的行
# grep -v ^# /etc/vsftpd/vsftpd.conf    匹配不以#號開頭的行
# grep -A 5 mail passwd                     匹配包含mail關鍵字及其后5行
# grep -B 5 mail passwd                     匹配包含mail關鍵字及其前5行
# grep -C 5 mail passwd                     匹配包含mail關鍵字及其前后5行

2. cut工具

cut是列截取工具,用于列的截取

語法和選項

語法:

# cut 選項  文件名

常見選項:

-c: 以字符為單位進行分割,截取
-d: 自定義分隔符,默認為制表符\t
-f: 與-d一起使用,指定截取哪個區域

舉例說明:

# cut -d: -f1 1.txt             以:冒號分割,截取第1列內容
# cut -d: -f1,6,7 1.txt     以:冒號分割,截取第1,6,7列內容
# cut -c4 1.txt                 截取文件中每行第4個字符
# cut -c1-4 1.txt           截取文件中每行的1-4個字符
# cut -c4-10 1.txt          截取文件中每行的4-10個字符
# cut -c5- 1.txt                從第5個字符開始截取后面所有字符

3. sort工具

sort工具用于排序;它將文件的每一行作為一個單位,從首字符向后,依次按ASCII碼值進行比較,最后將他們按升序輸出。

語法和選項
-u :去除重復行
-r :降序排列,默認是升序
-o : 將排序結果輸出到文件中,類似重定向符號>
-n :以數字排序,默認是按字符排序
-t :分隔符
-k :第N列
-b :忽略前導空格。
-R :隨機排序,每次運行的結果均不同

舉例說明

# sort -n -t: -k3 1.txt             按照用戶的uid進行升序排列
# sort -nr -t: -k3 1.txt            按照用戶的uid進行降序排列
# sort -n 2.txt                         按照數字排序
# sort -nu 2.txt                        按照數字排序并且去重
# sort -nr 2.txt 
# sort -nru 2.txt 
# sort -nru 2.txt 
# sort -n 2.txt -o 3.txt            按照數字排序并將結果重定向到文件
# sort -R 2.txt 
# sort -u 2.txt 

4.uniq工具

uniq用于去除==連續==的==重復==行

常見選項:
-i: 忽略大小寫
-c: 統計重復行次數
-d:只顯示重復行

舉例說明:
# uniq 2.txt 
# uniq -d 2.txt 
# uniq -dc 2.txt 

5.tee工具

tee工具是從標準輸入讀取并寫入到標準輸出和文件,即:雙向覆蓋重定向(屏幕輸出|文本輸入)

選項:
-a 雙向追加重定向

# echo hello world
# echo hello world|tee file1
# cat file1 
# echo 999|tee -a file1
# cat file1 

6.diff工具

diff工具用于逐行比較文件的不同

注意:diff描述兩個文件不同的方式是告訴我們==怎樣改變第一個==文件之后==與第二個文件匹配==。

語法和選項

語法:

diff [選項] 文件1 文件2

常用選項:

選項含義備注
-b不檢查空格
-B不檢查空白行
-i不檢查大小寫
-w忽略所有的空格
--normal正常格式顯示(默認)
-c上下文格式顯示
-u合并格式顯示

舉例說明:

  • 比較兩個==普通文件==異同,文件準備:
[root@MissHou ~]# cat file1
aaaa
111
hello world
222
333
bbb
[root@MissHou ~]#
[root@MissHou ~]# cat file2
aaa
hello
111
222
bbb
333
world

1)正常顯示

diff目的:file1如何改變才能和file2匹配
[root@MissHou ~]# diff file1 file2
1c1,2                   第一個文件的第1行需要改變(c=change)才能和第二個文件的第1到2行匹配         
< aaaa              小于號"<"表示左邊文件(file1)文件內容
---                 ---表示分隔符
> aaa                   大于號">"表示右邊文件(file2)文件內容
> hello
3d3                 第一個文件的第3行刪除(d=delete)后才能和第二個文件的第3行匹配
< hello world
5d4                 第一個文件的第5行刪除后才能和第二個文件的第4行匹配
< 333
6a6,7                   第一個文件的第6行增加(a=add)內容后才能和第二個文件的第6到7行匹配
> 333                   需要增加的內容在第二個文件里是333和world
> world

2)上下文格式顯示

[root@MissHou ~]# diff -c file1 file2
前兩行主要列出需要比較的文件名和文件的時間戳;文件名前面的符號***表示file1,---表示file2
*** file1       2019-04-16 16:26:05.748650262 +0800
--- file2       2019-04-16 16:26:30.470646030 +0800
*************** 我是分隔符
*** 1,6 ****        以***開頭表示file1文件,1,6表示1到6行
! aaaa              !表示該行需要修改才與第二個文件匹配
  111
- hello world       -表示需要刪除該行才與第二個文件匹配
  222
- 333                   -表示需要刪除該行才與第二個文件匹配
  bbb
--- 1,7 ----        以---開頭表示file2文件,1,7表示1到7行
! aaa                   表示第一個文件需要修改才與第二個文件匹配
! hello             表示第一個文件需要修改才與第二個文件匹配
  111
  222
  bbb
+ 333                   表示第一個文件需要加上該行才與第二個文件匹配
+ world             表示第一個文件需要加上該行才與第二個文件匹配

3)合并格式顯示

[root@MissHou ~]# diff -u file1 file2
前兩行主要列出需要比較的文件名和文件的時間戳;文件名前面的符號---表示file1,+++表示file2
--- file1       2019-04-16 16:26:05.748650262 +0800
+++ file2       2019-04-16 16:26:30.470646030 +0800
@@ -1,6 +1,7 @@
-aaaa
+aaa
+hello
 111
-hello world
 222
-333
 bbb
+333
+world
  • 比較兩個==目錄不同==
默認情況下也會比較兩個目錄里相同文件的內容
[root@MissHou  tmp]# diff dir1 dir2
diff dir1/file1 dir2/file1
0a1
> hello
Only in dir1: file3
Only in dir2: test1
如果只需要比較兩個目錄里文件的不同,不需要進一步比較文件內容,需要加-q選項
[root@MissHou  tmp]# diff -q dir1 dir2
Files dir1/file1 and dir2/file1 differ
Only in dir1: file3
Only in dir2: test1

其他小技巧:

有時候我們需要以一個文件為標準,去修改其他文件,并且修改的地方較多時,我們可以通過打補丁的方式完成。

1)先找出文件不同,然后輸出到一個文件
[root@MissHou ~]# diff -uN file1 file2 > file.patch
-u:上下文模式
-N:將不存在的文件當作空文件
2)將不同內容打補丁到文件
[root@MissHou ~]# patch file1 file.patch
patching file file1
3)測試驗證
[root@MissHou ~]# diff file1 file2
[root@MissHou ~]#

7. paste工具

paste工具用于合并文件行

常用選項:
-d:自定義間隔符,默認是tab
-s:串行處理,非并行

##8. tr工具

tr用于字符轉換,替換和刪除;主要用于==刪除文件中控制字符==或進行==字符轉換==

語法和選項

語法:

用法1:命令的執行結果交給tr處理,其中string1用于查詢,string2用于轉換處理
# commands|tr  'string1'  'string2'
用法2:tr處理的內容來自文件,記住要使用"<"標準輸入
# tr  'string1'  'string2' < filename

用法3:匹配string1進行相應操作,如刪除操作
# tr options 'string1' < filename

常用選項:

-d 刪除字符串1中所有輸入字符。
-s 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串

常匹配字符串:

字符串含義備注
==a-z==或[:lower:]匹配所有小寫字母[a-zA-Z0-9]
==A-Z==或[:upper:]匹配所有大寫字母
==0-9==或[:digit:]匹配所有數字
[:alnum:]匹配所有字母和數字
[:alpha:]匹配所有字母
[:blank:]所有水平空白
[:punct:]匹配所有標點符號
[:space:]所有水平或垂直的空格
[:cntrl:]所有控制字符\f Ctrl-L        走行換頁<br/>\n Ctrl-J     換行

\r Ctrl-M        回車
\t Ctrl-I   tab鍵 |

舉例說明:

[root@MissHou  shell01]# cat 3.txt  自己創建該文件用于測試
ROOT:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
boss02:x:516:511::/home/boss02:/bin/bash
vip:x:517:517::/home/vip:/bin/bash
stu1:x:518:518::/home/stu1:/bin/bash
mailnull:x:47:47::/var/spool/mqueue:/sbin/nologin
smmsp:x:51:51::/var/spool/mqueue:/sbin/nologin
aaaaaaaaaaaaaaaaaaaa
bbbbbb111111122222222222233333333cccccccc
hello world 888
666
777
999

# tr -d '[:/]' < 3.txt              刪除文件中的:和/
# cat 3.txt |tr -d '[:/]'           刪除文件中的:和/
# tr '[0-9]' '@' < 3.txt            將文件中的數字替換為@符號
# tr '[a-z]' '[A-Z]' < 3.txt        將文件中的小寫字母替換成大寫字母
# tr -s '[a-z]' < 3.txt             匹配小寫字母并將重復的壓縮為一個
# tr -s '[a-z0-9]' < 3.txt      匹配小寫字母和數字并將重復的壓縮為一個
# tr -d '[:digit:]' < 3.txt         刪除文件中的數字
# tr -d '[:blank:]' < 3.txt         刪除水平空白
# tr -d '[:space:]' < 3.txt         刪除所有水平和垂直空白
小試牛刀
  1. 使用小工具分別截取當前主機IP;截取NETMASK;截取廣播地址;截取MAC地址
# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4
10.1.1.1:10.1.1.255:255.255.255.0
# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '\n'
10.1.1.1
10.1.1.255
255.255.255.0
# ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f4
00:0C:29:25:AE:54
# ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f5
00:0C:29:B4:9E:4E

# ifconfig eth2|grep Bcast|cut -d: -f2|cut -d' ' -f1
# ifconfig eth2|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'
# ifconfig eth2|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '\n'|grep -v ^$
# ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '\n'|grep -v ^$
# ifconfig eth2|grep HWaddr|cut -d ' ' -f11
# ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth2|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '\n'|grep -v '^$'
  1. 將系統中所有普通用戶的用戶名、密碼和默認shell保存到一個文件中,要求用戶名密碼和默認shell之間用tab鍵分割
# grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '\t' |tee abc.txt

以上就是shell腳本中文本處理工具的介紹和使用,工具的詳細使用情況還得要大家自己使用過才能知道具體要領。如果想閱讀更多相關內容的文章,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

北安市| 准格尔旗| 南靖县| 乐平市| 新余市| 吉首市| 乐陵市| 建宁县| 连山| 永福县| 进贤县| 汽车| 大宁县| 天等县| 鄂托克旗| 平顶山市| 平谷区| 吉林省| 仁化县| 景谷| 临汾市| 遂川县| 怀化市| 玉龙| 类乌齐县| 本溪| 融水| 瑞丽市| 陕西省| 茌平县| 平潭县| 长治市| 宝鸡市| 福建省| 武功县| 广州市| 铁岭市| 敖汉旗| 永兴县| 屏东市| 平远县|