python 資料處理基本操作 持續更新

2021-09-13 12:25:21 字數 3387 閱讀 6329

data = pd.read_csv(path,header,names=['','']     #返回dataframe物件

#畫圖data.plt(kind='scatter',x='',y='') #scatter散點圖

plt.show()

str.strip('char')         用於移除字串**頭尾**指定的字元(預設為空格)或字串行。

split() 分隔

import numpy as np

np.r_[a,b]

#是按行連線兩個矩陣,就是把兩矩陣上下相連,要求列數相等,類似於pandas中的 concat()。

np.c_[a,b]

#是按列連線兩個矩陣,就是把兩矩陣左右相連,要求行數相等,類似於pandas中的 merge()。

print(「ring」 in 「strings」) #true

print(「wow」 in 「amazing!」) #false

print(「yes」 in 「yes!」) #false

print("" in 「no way!」) #true

讀寫檔案基本使用 with open…as…方式,這樣子安全!

with

open

('path'

,'method'

)as f:

f.read

() #可讀取整個檔案,也可自行設定大小,如 f.

read

(100

) f.

readline

() #一次讀取一行

f.readlines

() #可讀取整個檔案,按行讀取

f.write

(text) #寫入text內容

f.close

() #關閉檔案

method型別:

method描述r

開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。

rb以二進位制格式開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。

r+開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。

rb+以二進位制格式開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。

w開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。

wb以二進位制格式開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。

w+開啟乙個檔案用於讀寫 。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。

wb+以二進位制格式開啟乙個檔案用於讀寫。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。

a開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。如果該檔案不存在,建立新檔案進行寫入。

ab以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該檔案不存在,建立新檔案進行寫入。

a+開啟乙個檔案用於讀寫。如果該檔案已存在,檔案指標將會放在檔案的結尾。檔案開啟時會是追加模式。如果該檔案不存在,建立新檔案用於讀寫。

ab+以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。如果該檔案不存在,建立新檔案用於讀寫。

1、json.dumps()

用於將dict型別的資料轉成str,因為如果直接將dict型別的資料寫入json檔案中會發生報錯,因此在將資料寫入時需要用到該函式。

import json

dict =

str = json.dumps(dict)

print(dict)

print(str)

#輸出結果

#字典型別

#字串型別

2、json.loads()

用於將str型別的資料轉成dict

import json

dict1 =

str = json.dumps(dict)

dict2 = json.loads(dict1)

#輸出結果, 'a'變成了u'a'是因為發生了型別轉換,str會轉換成unicode

附上python轉換型別……

3、json.dump()

用於將dict型別的資料轉成str,並寫入到json檔案中。下面兩種方法都可以將資料寫入json檔案

import json

#方法一:

str = json.dumps(dict)

with open('file_name', "w") as f:

f.write(str)

方法二:

json.dump(dict, open('file_name', "w"))

4、json.load()

從json檔案中讀取資料

import json

emb_filename = ('/home/cqh/facedata/emb_json.json')

jsobj = json.load(open(emb_filename))

print(jsobj)

print(type(jsobj))

for key in jsobj.keys():

print('key: %s value: %s' % (key,jsobj.get(key)))

#執行結果

key: a value: 1111

key: c value: 3333

key: b value: 2222

key: d value: 4444

import requests,json

url = '...'

r = requests.get(url)

data = json.dumps(r.json())

print(type(r)) #requests.models.response型別

print(type(r.json())) #dict / list資料型別

print(type(data)) #返回str資料型別

r.text #http響應內容的字串形式,即:url對應的頁面內容

r.content #http響應內容的二進位制形式

python中基本資料處理

def function a,b if a 0 b 0 return 只做夜班 elif a 0 b 0 return 只做白班 elif a 0 b 0 return 未做單 else return 混合 function x.夜間上班時長,x.日間上班時長 axis 1 例 有某工廠工人上班時間...

python 資料處理之分箱操作

什麼是分箱?簡單點說就是將不同的東西,按照特定的條件放到乙個指定容器裡,比如水果 把綠色的放乙個籃子裡,紅色乙個籃子等等,這個籃子就是箱,而水果就是資料 顏色就是條件 什麼樣式的資料要進行分箱 資料主要分為連續變數和分類變數,分箱的操作主要針對於連續變數。為什麼要對資料進行分箱操作 穩定性,時間複雜...

Python 資料處理

將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...