Notepad 正規表示式 中文處理

2021-08-11 12:17:28 字數 676 閱讀 8514

最近總是回憶。

上個月大腦時不時閃回到初一初二,傻傻的賴在別人家看電視劇集,沉浸在光怪陸離的武俠世界裡。

忽然想到,有一部武俠劇我只看過幾集,雖然現如今留下的回憶不多,但對女主角卻有很深的印象。一時間心血來潮,上網搜尋起來。沒想到,只用了5分鐘,就找到了,飛花逐月。

看了簡介,驚訝地發現,裡面的男女主角都是大名鼎鼎的人物:黃元申、苗可秀。其原作者也是香港的名人臥龍生。這竟然是一部被嚴重低估的大作!

和同事聊天,腦中靈光一閃:再試試古龍的**吧。

於是今天找到了txt版的《多情劍客無情劍》。

據說這是古龍的巔峰之作。希望不要再讓我失望。

我把txt粘到wps裡,想匯出成pdf到kindle。忽然發現txt版有很多多餘的回車(換行)。如下所示:

最終用正規表示式替換掉了所有的回車。

有的換行是沒問題的,要保留。有問題的是第二行開頭有中文字的(非空格)。這個尾綴很重要,因為中文都是雙字元表示。不寫2的話會出現亂碼。

notepad 正規表示式

將文字中test值都首位加11 使用查詢test 替換test 11 1。也可使用查詢test 0 9 其它 t 製表符.n 新行.匹配任意字元.匹配表示式左邊和右邊的字元.例如,zy yc 匹配 zy 或者 yc 匹配列表之中的任何單個字元.例如,zy 匹配 z 或者 y 0 9 匹配任意數字或者...

notepad 正規表示式

匹配行的開始 顯示搜尋字串必須在行的開始,但是在所選擇的結果字串中不包括任何行終止字元。匹配行尾 顯示搜尋字串必須在行尾,但是在所選擇的結果字串中不包括任何行終止字元。除了換行符以外匹配任何單個的字元 乙個正規表示式最多可以有9個標註表示式,按正規表示式的需要而定。相應的替換表示式是 x 替換範圍x...

Notepad 與正規表示式

notepad 是一款自由的編輯器,適合編輯各種源 也可作為替代記事本的工具。它與前日提到的 scite 都使用了 scintilla 昨天賣了個關子,今天就在此略微 一下正規表示式。眼下已經有了各公司的 檔案,000002 000006 排成一列,要想變成 公司 該如何做呢?為了簡便起見,就用 u...