python提取具有某種特定字串的行資料方法

2022-10-04 18:36:10 字數 2083 閱讀 8901

今天又幫女朋友處理了一下,她的實驗資料,因為python是一年前經常用,最近找工作,用的是c,c++,python的有些東西忘記了,然後就一直催我,說我弄的慢,弄的慢,你自己弄啊,煩不煩啊,逼逼叨叨的,最後還不是我給弄好的?呵呵

好的,資料是這樣的,我截個圖

我用紅括號括起來的,就是我所要提取的資料

其中lossstotal.txt是我要提取的原始資料,考慮兩種方法去提取,前期以為所要提取行的資料是有一定規律的,後來發現,並不是,所以,我考慮用正則來提取,經過思考以後,完成了資料的提取,如下午所示,資料變的非常好看

**如下:

#coding:utf-8

#__author__ ='dell'

import re

f1=file('losstotal.txt','r')

data1=f1.readlines()

# print data1

f程式設計客棧1.close()

results =

f2 = open('loss2.txt', 'w')

# # 按照特定行提取,發現後面的行並無規律

# i = 0

# for line in data1:

# i+=1

# # print line

# if((i-1)%3==0):

# f2.write(line)

# print line

# 利用正規表示式

for line in data1:

data2=line.split()

# print data2

for i in data2:

n = re.findall(r"iteration", i)

# m=re.findall(r"loss", i)

if n:

# print line

f2.writelines(line)

f2.close()

f3=file('loss2.txt','r')

data3=f3.readlines()

# print data1

f3.close()

f4 = open('loss3.txt', 'w')

for line in data3:

data4=line.split()

# print data2

for i in data4:

n = re.findall(r"loss", i

# m=re.findall(r"loss", i)

if n:

print line

f4.writelines(line)

f4.close()

# 去掉逗號

f5=open('loss3.txt','r')

data5=f5.reagypxuggrhd()

f5=data5.replace(',',' ')

f6=file('lossfinal.txt','w')

f6.write(f5)

f6.close()

# # 去掉等號=

f7=open('lossfinal.txt','r')

data7=f7.read()

f7=data7.replace('=',' ')

f8=file('lossfinal.txt','w')

f8.write(f7)

f8.close()

# data3=lin.spl

# for j in data3:

# m=re.findall(r"loss",i)

# if m:

# print lin

# # m=re.findall(r"sgd_so程式設計客棧lver.cpp",i)

# n=re.findall(r"iteration",i)

我在同樣的目錄下,還建立了

這幾個txt檔案,要不然,**跑不通的喲。

解釋:我連續用了兩個正則,各自把含有特定字串的行進行提取,兩個寫一起,發現還是不太會,所以分開寫了,但是結果還是完成的不錯!

本文標題: python提取具有某種特定字串的行資料方法

本文位址:

python 關鍵字提取

jieba 關鍵字提取 import jieba.analyse tags jieba.analyse.extract tags str,topk 3 str是提取關鍵字的內容,topk是提取關鍵字數 print join tags tf idf關鍵字提取 是用於資訊檢索和文字挖掘的加權技術。是評估...

python 提取目錄中特定型別的檔案

python使用 os 和 re 模組提取目錄中特定型別的檔案,這兩個模都是安裝python自帶的,所以不需要安裝。思路 使用os庫lilstdir獲取資料夾中的所有檔名,然後帶上資料夾路徑組合成為完整絕對路徑,然後去判斷該路徑檔案的型別,如果是檔案,使用re庫正則相關函式去篩選出特定字尾的檔案 如...

python提取txt中的特定字元工具

由於工作需要需要提取乙個txt檔案中的特定字元 原始檔案結構如下 logon name xiaoming display name 中國小明 user password 123 org name logon name xiaohuang display name 中國小黃 user password...