尋找txt中相同的行 Pandas讀取txt

2021-10-14 20:21:25 字數 930 閱讀 3528

pandas讀txt和excel

乙個小練習:pandas讀取txt檔案

read_table

read_table和read_csv類似,區別在於csv是sep以逗號為分隔,txt預設是tab作為分隔

先用help檢視read_table的引數

用這幾個比較常用的作為例子:

filepath_or_buffer:讀取檔案的位置,字首加r(raw)表示後面是原生字元

sep:行的資料進行拆分的字元

header:以原始資料哪行做標題,無標題用names重新命名列標題

names:結果重新命名列標題

skiprows:從首行開始忽略跳過的行

nrows:需要讀取多少行資料,如有跳過行跳過的行不算

comment:遇到指定注釋符則跳過該行

例:讀取桌面11.txt文件中的5行內容要求

1)跳過3行無效資料

2)標題重新命名『快捷鍵』

3)跳過標記為『#』的行(這樣有#則不會被讀取)

結果及**如下:

header=none, #沒有標題

names=['快捷鍵'], #為列命名

skiprows=3, #跳過前兩行

nrows=5, #讀取5行

comment='#'  # 跳過指定注釋符號跳過該行

datatxt

尋找輸入中的相鄰相同行

程式具體要求 如果檔案中有2行或更多相鄰的文字內容相同,那麼久列印出其中一行,其餘的行不列印。假設檔案中文本行在長度上不會超過128個字元,127個字元加上用於終結文字行的換行符 考慮下面的輸入檔案。this is the first line.another line.and another.an...

尋找相同元素的指標

此例項的要求是在兩個已經擺好順序的陣列尋找第乙個相同的元素在第乙個陣列中的指標。這個例項的思想比較好,如果我來做的話,就是先從第乙個陣列的第乙個元素開始,每次取出乙個元素,與第二個陣列的每乙個元素進行比較,當元素值相等的時候,返回元素的指標。但是在此例項中,使用了另外一種思想,在我看來降低了程式的時...

尋找陣列中不相同元素的個數

題意 乙個整數陣列,計算該陣列中不相同整數的個數。如a 則輸出不相同的個數為7.方法一是使用hash陣列,將hash陣列裡面的數全部制為0 然後hash a i 為0時,將其設定為1 最後hash陣列的和就是不同數字的數目。此種方法的缺點就是只能適合整形陣列,其他陣列不適合 但是優點就是時間複雜度小...