踩坑系列 python資料處理

2022-08-23 16:06:08 字數 744 閱讀 1519

最近利用python讀取txt檔案時遇到了乙個小問題,就是在計算兩個np.narray()型別的陣列時,出現了以下錯誤:

typeerror: ufunc 'subtract' did not contain a loop with signature matching types dtype('作為乙個new pythoner,遇到這個問題花了很多時間,最後終於解決了。

總結如下:

1.出現此問題的原因是:目的是想計算兩個陣列間的差值,但陣列中的元素不是資料型別(float或者int等),而是str型別的。

2.解決方法:在為空陣列新增資料過程中,將每個資料強制轉化為float型

多餘字元的刪除

首先,我們要刪除多餘的符號,獲得乾淨的資料。

經過查詢資料,知道刪除一條文字資料中不需要的符號,可以通過re.sub(chara,newchara,data)函式實現,其中chara是需要刪除的字元,newchara是刪除字元後相應位置的替換字元,data是需要操作的資料。比如下面的**,指的是刪除lines中包含的前面列出的字元,並用空白替換:

linestring = re.sub("[\n.!/_-$%^(+"')]+|[+—()?【】「」!:,;.?、~@#¥%…&()0123456789]+", " ", lines)

python對多檔案的操作

本文內容為之前收集自網際網路,原址已不詳,見諒,僅作為踩坑記錄。

無視下面的鏈結,僅作為圖鏈備忘語法寫法

資料處理踩過的坑1

python list列表查詢相同元素下標位置list position name 網路工程師 網路工程師 884 軟體測試工程師 測試工程師 軟硬體測試工程師 測試工程師 網路工程師 軟體測試 軟體測試 常州 list price positoin address for i in list po...

python 踩坑系列之遲繫結

將函式體和函式呼叫關聯起來,就叫繫結 在程式執行之前 也就是編譯和鏈結時 執行的繫結是早繫結,遲繫結 late binding 是發生在執行時。def outer return lambda x x i for i in range 3 f1,f2,f3 outer print f1 1 print...

Python 資料處理

將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...