文字處理器 wc cut sort uniq

2022-05-01 02:30:09 字數 745 閱讀 4137

wc 

word count統計文字檔案中的字元個數

用法: wc filename

行數  字元個數  檔案大小 (位元組)  檔名

-l-w

-ccut 

用來做檔案分隔

-d   指定分隔符(delimiter)

-d[ :]不行

-f  指定輸出的列資料:

-f2-f1-3

-f1,3

--output-delimiter='xx'

[cut的侷限性:1、-d指定分隔符,不能同時指定多個2、不能做高階的格式化輸出;所以我要熟練掌握awk]

sort

排序,預設檢視第乙個字元(包括數字字母以及空格和特殊字元),以ascii碼來排序(大小寫不是)

-f 忽略大小寫的差異, 例如a與a視為編碼相同;

-b忽略最前面的空格符部分;

-m以月份的名字來排序,例如jan dec等等的排序方法;

-n使用純數字進行排序,預設是以檔案形態來排序的;

-r反向排序;

-u就是uniq,相同的資料中,僅出現一行代表;

-t分隔符,預設是用tab鍵分割;

-k以那個區間(field)來進行排序的意思

uniq

連續且相同的命令,才被視為重複

建議,先排序,後去重

tar 歸檔-》 對目錄

-c統計某些字元重複次數(重要)

sort filename | uniq -c

vim文字處理器

linux 下的vi 是一種文字編輯器,後來的公升級版本是vim。vi 分為三種模式 一般模式 編輯模式 命令命令模式。它們之間的關係如下 下面分類別解析命令 注意是 那個鍵 返回到游標剛才的位置 ctrl f往下翻頁 forward ctrl b往上翻頁 backward n 移動到本行的第n列 ...

文字處理器sed

sed是一種流編輯器,一次處理一行,處理空間被稱為模式空間,配合正規表示式與shell指令碼使用廣泛。預設列印p選項 n 關閉預設列印 i.bak 將原檔案複製為.bak備份檔案,並修改原檔案 r 配合擴充套件表示式 支援正規表示式,用 pattern 格式 位址界定不給定位址 對全文進行處理 pa...

Box推出文字處理器Box Notes

drive。儘管該產品還處在成長初期,但有訊息顯示box notes的功能已較為成熟,涵蓋協作式和線下編輯 版本歷史以及ios和android 版的移動應用。box目前正在對該產品進行測試,有報道稱box將在明年正式推出該服務。儘管box目前為消費者提供免費的賬戶,但該公司關注的重點仍是企業 市場,...