處理 TXT 文字技巧

2021-09-23 07:39:32 字數 921 閱讀 9174

在一些場景會碰到需要從 txt 文字檔案提取需要的**,txt 文字並沒有固定的格式,所以基本上每乙個不同的 txt 文字都需要單獨寫程式,下面是一些我在專案中用到的 txt 文字處理技巧。

有用到的 python 處理 txt **:

# 開啟 txt 文字

with open("*.txt","r") as f:

# 逐行讀取 txt 文字內容

info=f.readlines()

# 按空格逐行分解每一行資料

for ls in info:

info_list = ls.strip()

由於 txt 文字並沒有固定的格式,所以基本上不可能碰到可以重複復用的 txt 公式,靈活運用上面的公式,或者也可以使用一些 python 的第三方庫來輔助。每當我們拿到乙個 txt 文字資料時,首先要做的事和客戶溝通確定該文字的樣式和瞄點,總結規律,比如通過定位 txt 文字中的唯一值來定位所需求的資料,或者為什麼我們要逐行讀取 txt 文字,因為大部分 txt 文字都是有固定的行和列,舉個例子:

citic industrial bank

外卡收單 m/c 資金清算報表

報表號碼: 報表日期 2018-08-15 貨幣 840

交易型別 筆數 交易金額 手續費收入 手續費支出 結算金額 其他金額 清算日期

atm 59 12237.53 97.63 12335.16 0.00 2018-08-14

合計: 59 12237.53 97.63 0.00 12335.16 0.00

* * * 報表結束 * * *

如上的 txt 文件,我們需要讀取合計一欄的結算金額,我先逐行讀取 txt **,然後瞄定『合計『(此值唯一),然後用 split 函式分割資料,取分割後得到的列表的倒數第 3 個資料就是結算金額了。

藝賽旗RPA 處理 TXT 文字技巧

在 rpa 的一些場景會碰到需要從 txt 文字檔案提取需要的 txt 文字並沒有固定的格式,所以基本上每乙個不同的 txt 文字都需要單獨寫程式,下面是一些我在專案中用到的 txt 文字處理技巧。有用到的 python 處理 txt 開啟 txt 文字 file new open txt r 逐行...

python 處理文字( txt檔案)

參考 if pos 1 content content pos content add content pos 參考 findall 注意 返回的是匹配的字串,若沒有匹配,返回,而不是什麼也不返回 參考 keys a b c values 1,2,3 dictionary dict zip keys...

利用python處理txt文字,調整格式

具體任務為 將其中人名分離,每個單獨一行,待處理文字如下 實驗可以自己複製 田德懋 薛濬 王頒 楊慶 郭俊 田翼 紐回 劉士俊 郎方貴 翟普林 李德饒 華秋 徐孝肅 列傳第三十八 循吏 梁彥光 樊叔略 趙軌 房恭懿 公孫景茂 辛公義 柳儉 郭絢 敬肅 劉曠 王伽 魏德深 列傳第三十九 酷吏 厙狄士文...