日常小記 統計字尾名為 cc c h的檔案數

2021-09-22 07:27:36 字數 3975 閱讀 1158

2011-03-29 16:50 by 吳秦,

5801 閱讀,

收藏,

編輯在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc、.c、.h的檔案。下面介紹linux幾種方法統計字尾名為.cc、.c、.h的檔案數的方法。

我以python3的源**為例,python3的原始碼共有檔案數:

這段時間在學習python3,我就把它作為例子啦。感慨下:python3跟python2比變化了好多!有興趣的同學可以從**庫中checkout**研究研究,過程如下:(python3使用git管理**)

分別統計.cc和.c/.h的檔案數,然後加起來。

+ view code?

1find. -name"*.cc"|wc-l ;find. -name"*.[c|h]"|wc-l

結果如下:

雖然可以得到正確結果,不過就看上去比較醜。

+ view code?

1find. \( -name"*.cc"-or -name"*.c"-or -name"*.h"\) |wc-l

使用-or命令連線多個表示式,注意使用圓括號「()」把所有的-name表示式括起來,並且需要轉義!結果如下:

使用正規表示式,但是需要注意進行轉義。結果如下:

附常用正規表示式符號意義:

\將下乙個字元標記為乙個特殊字元、或乙個原義字元、或乙個後向引用、或乙個八進位制轉義符。

^匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,^ 也匹配 』\n』 或 』\r』 之後的位置。

$匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性,$ 也匹配 』\n』 或 』\r』 之前的位置。

*匹配前面的子表示式零次或多次。

+匹配前面的子表示式一次或多次。+ 等價於 。

?匹配前面的子表示式零次或一次。? 等價於 。

n 是乙個非負整數,匹配確定的n 次。

n 是乙個非負整數,至少匹配n 次。

m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。

?當該字元緊跟在任何乙個其他限制符 (*, +, ?, , , ) 後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。

.匹配除 「\n」 之外的任何單個字元。要匹配包括 』\n』 在內的任何字元,請使用象 』[.\n]』 的模式。

(pattern)匹配pattern 並獲取這一匹配。

(?:pattern)匹配pattern 但不獲取匹配結果,也就是說這是乙個非獲取匹配,不進行儲存供以後使用。

(?=pattern)正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是乙個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。

(?!pattern)負向預查,與(?=pattern)作用相反

x|y匹配 x 或 y。

[xyz]字元集合。

[^xyz]負值字元集合。

[a-z]字元範圍,匹配指定範圍內的任意字元。

[^a-z]負值字元範圍,匹配任何不在指定範圍內的任意字元。

\b匹配乙個單詞邊界,也就是指單詞和空格間的位置。

\b匹配非單詞邊界。

\cx匹配由x指明的控制字元。

\d匹配乙個數字字元。等價於 [0-9]。

\d匹配乙個非數字字元。等價於 [^0-9]。

\f匹配乙個換頁符。等價於 \x0c 和 \cl。

\n匹配乙個換行符。等價於 \x0a 和 \cj。

\r匹配乙個回車符。等價於 \x0d 和 \cm。

\s匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。

\s匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。

\t匹配乙個製表符。等價於 \x09 和 \ci。

\v匹配乙個垂直製表符。等價於 \x0b 和 \ck。

\w匹配包括下劃線的任何單詞字元。等價於』[a-za-z0-9_]』。

\w匹配任何非單詞字元。等價於 』[^a-za-z0-9_]』。

\xn匹配 n,其中 n 為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。

\num匹配 num,其中num是乙個正整數。對所獲取的匹配的引用。

\n標識乙個八進位制轉義值或乙個後向引用。如果 \n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為乙個八進位制轉義值。

\nm標識乙個八進位制轉義值或乙個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 \nm 之前至少有 n 個獲取,則 n 為乙個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均為八進位制數字 (0-7),則 \nm 將匹配八進位制轉義值 nm。

\nml如果 n 為八進位制數字 (0-3),且 m 和 l 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。

\un匹配 n,其中 n 是乙個用四個十六進製制數字表示的unicode字元。

摘自《精通正規表示式》

日常小記 統計字尾名為 cc c h的檔案數

在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc c h的檔案。下面介紹linux幾種方法統計字尾名為.cc c h的檔案數的方法。我以python3的源 為例,python3的原始碼共有檔案數 這段時間在學習python3,我就把它作為例子啦。感慨下 python3跟python2比變化...

日常小記 統計字尾名為 cc c h的檔案數

在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc c h的檔案。下面介紹linux幾種方法統計字尾名為.cc c h的檔案數的方法。我以python3的源 為例,python3的原始碼共有檔案數 這段時間在學習python3,我就把它作為例子啦。感慨下 python3跟python2比變化...

獲取檔案的字尾名

使用api pathfindextension實現獲取給定乙個檔案,直接獲取檔案的字尾名 如 檔名 hsduiew.txt jhdsi.adiwey 路徑 檔名 c hsh shsh tetet.txt 都可以直接獲取到字尾名。pathfindextension函式說明 函式原型 ptstr pat...