shell中對文字的一些處理

2021-07-09 04:18:14 字數 1288 閱讀 3521

1:echo 輸出文字,預設情況下會自動在末尾新增乙個換行符,-n選項可以取消換行符

2:顯示變數的時候加{},

var=」hi」

echo 「this is test va

rtes

t」結果

為thi

sist

est」

所以要想

得到正確

的結果可

以改為e

cho「

this

iste

sttest」。

3:用反引號來輸出命令執行的結果,另外echo只把結果作為一行輸出來。

3:echo結果重定向 > 覆蓋檔案的原來的內容 >>追加到檔案的末尾

4:fold命令格式化行

fold [option] [file…]

option 選項

:-s 在空格處折斷行,在和w一起使用的時候,若當前單詞還沒輸出完,則繼續輸出不換行

-w 指定寬度 預設80列

5:sort (sort預設情況下以連續的空格或者製表符作為列的分隔符)

sort [option] [file]

-k pos1[,pos2] 以pos1-pso2列作為排序比較關鍵字,乙個文字行最多只能包括10列比較,省略pos2表示從pos1開始,直到滿額

-k pos1[.start] [,pos2[.end]]

從pos1列的第start個字元到pos2列的end個字元都是排序關鍵字的組成部分。連續的使用-k可以對多個關鍵字排序

-r 降序排列

-n 數值列的排序 但是對於非數字字元則結果沒有預期

-t 自定義列分隔

-u 排序而且刪除重複的行

sort file1 file2 > result

將file1和file2中的內容合併在一起,排序後輸出到result 也可以使用上面的一些選項。

6:wc命令

wc [option] [file]

-c 統計文字的位元組數

-m 統計字元數

-l 統計行數

-l 最長行的長度

-w 單詞數

7:cut命令及其語法

cut option [file]

-d 自定義分隔符,預設值為製表符

-f 只選擇列表中指定的文字列,文字列用列號表示,多個列之間用逗號隔開。用-連線連續的列。

-s 不輸出不包含列分隔符的行

-c 表示選擇字元

cut -c list 不能指列分隔符 list和指定列的格式一樣

c 中對檔案的一些操作

include include include using namespace std int main if outfile int a,b int i 0,j 0 int data 6 2 while myfile.eof myfile.close for int k 0 k outfile c...

shell中的一些命令

shutdown h now 關機 vim 開啟某個檔案 後台執行指令碼 進入指令碼的目錄下 nohup python manage.py 指令碼名 ps ef grep python 看後台有哪些本專案的任務在執行 mysql h主機名 u使用者名稱 p密碼 use databasename 使用...

NLP文字預處理的一些方法

寫在前面 隨著bert等技術的興起,在做文字方面比賽時,對於預處理這一塊像中文分詞,停用詞過濾,詞形還原,詞幹化,標點符號處理等變的不再這麼重要。當然也可以從另乙個角度來看,這些對於文字的預處理方法相當於減少輸入的雜訊,是可以讓神經網路更具有魯棒性的。所以以下內容可以作為乙個知識儲備在這裡,在工作中...