正規表示式實踐 去除字幕檔案中重複的字幕時間行

2021-09-14 02:37:54 字數 835 閱讀 4370

1

00:00:12,368 --> 00:00:13,784

00:00:12,368 --> 00:00:13,758 # 多餘一行,應刪除

200:00:13,808 --> 00:00:16,424

00:00:13,758 --> 00:00:16,398 # 多餘一行,應刪除

is one of the worst digital experiences of our time.

是我們這個時代最糟糕的 數位化體驗之一。

300:00:16,448 --> 00:00:19,144

00:00:16,398 --> 00:00:19,129 # 多餘一行,應刪除

面對面交談也沒好到哪兒去。

what?刪除多餘的第二行字幕時間資訊,目標輸出如下。

1

00:00:12,368 --> 00:00:13,784

200:00:13,808 --> 00:00:16,424

is one of the worst digital experiences of our time.

是我們這個時代最糟糕的 數位化體驗之一。

300:00:16,448 --> 00:00:19,144

面對面交談也沒好到哪兒去。

solution:正規表示式

## 待替換的pattern

(,\d+)\n0\d+.*?\d$

## 替換後的pattern

\1

正規表示式實踐

正規表示式通常用來檢索 替換符合匹配某個模式的文字。字元匹配 代表任意單個字元,乙個字母 數字或漢字等 代表指定範圍內的字元,abc 表示a,b,c 這3個字母中的任意乙個 表示排除 中的字元以外的字元 alnum 所有大小寫字母和數字,數量1 alpha 所有大小寫字母,數量1 blank 代表空...

mysql正規表示式實踐

1 統計表中category為空且http host為ip位址的行數。select count from log http 5 where category and http host regexp 0 9 0 9 0 9 2 字串拼接select concat username,id from a...

正規表示式去除html標籤

正確使用正規表示式過濾字串,講給工作帶來很大的方便。以下是以js標籤為例 script echo 去除所有js preg replace script script echo 將script標籤的內容列印出來 preg replace script script 解釋 開始 和 結束標示 非 字串 ...