python 資料處理基本操作持續更新

data = pd.read_csv(path,header,names=['','']     #返回dataframe物件
#畫圖data.plt(kind='scatter',x='',y='') #scatter散點圖
plt.show()

str.strip('char')         用於移除字串**頭尾**指定的字元（預設為空格）或字串行。
split() 分隔

import numpy as np
np.r_[a,b] 
#是按行連線兩個矩陣，就是把兩矩陣上下相連，要求列數相等，類似於pandas中的 concat()。
np.c_[a,b] 
#是按列連線兩個矩陣，就是把兩矩陣左右相連，要求行數相等，類似於pandas中的 merge()。

print(「ring」 in 「strings」) #true

print(「wow」 in 「amazing!」) #false

print(「yes」 in 「yes!」) #false

print("" in 「no way!」) #true

讀寫檔案基本使用 with open…as…方式，這樣子安全！

with
open
('path'
,'method'
)as f:
f.read
() #可讀取整個檔案,也可自行設定大小，如 f.
read
(100
) f.
readline
() #一次讀取一行
f.readlines
() #可讀取整個檔案，按行讀取
f.write
(text) #寫入text內容
f.close
() #關閉檔案

method型別：

method描述r

開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。

rb以二進位制格式開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。

r+開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。

rb+以二進位制格式開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。

w開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在，建立新檔案。

wb以二進位制格式開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在，建立新檔案。

w+開啟乙個檔案用於讀寫。如果該檔案已存在則將其覆蓋。如果該檔案不存在，建立新檔案。

wb+以二進位制格式開啟乙個檔案用於讀寫。如果該檔案已存在則將其覆蓋。如果該檔案不存在，建立新檔案。

a開啟乙個檔案用於追加。如果該檔案已存在，檔案指標將會放在檔案的結尾。如果該檔案不存在，建立新檔案進行寫入。

ab以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在，檔案指標將會放在檔案的結尾。也就是說，新的內容將會被寫入到已有內容之後。如果該檔案不存在，建立新檔案進行寫入。

a+開啟乙個檔案用於讀寫。如果該檔案已存在，檔案指標將會放在檔案的結尾。檔案開啟時會是追加模式。如果該檔案不存在，建立新檔案用於讀寫。

ab+以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在，檔案指標將會放在檔案的結尾。如果該檔案不存在，建立新檔案用於讀寫。

1、json.dumps()

用於將dict型別的資料轉成str，因為如果直接將dict型別的資料寫入json檔案中會發生報錯，因此在將資料寫入時需要用到該函式。

import json
dict = 
str = json.dumps(dict)
print(dict)
print(str)
#輸出結果
#字典型別
#字串型別

2、json.loads()

用於將str型別的資料轉成dict。

import json
dict1 = 
str = json.dumps(dict)
dict2 = json.loads(dict1)
#輸出結果， 'a'變成了u'a'是因為發生了型別轉換，str會轉換成unicode

附上python轉換型別……

3、json.dump()

用於將dict型別的資料轉成str，並寫入到json檔案中。下面兩種方法都可以將資料寫入json檔案

import json
#方法一：
str = json.dumps(dict) 
with open('file_name', "w") as f: 
f.write(str) 
方法二：
json.dump(dict, open('file_name', "w"))

4、json.load()

從json檔案中讀取資料

import json
emb_filename = ('/home/cqh/facedata/emb_json.json') 
jsobj = json.load(open(emb_filename)) 
print(jsobj)
print(type(jsobj))
for key in jsobj.keys():
print('key: %s value: %s' % (key,jsobj.get(key)))
#執行結果
key: a value: 1111
key: c value: 3333
key: b value: 2222
key: d value: 4444

import requests,json
url = '...'
r = requests.get(url) 
data = json.dumps(r.json()) 
print(type(r)) #requests.models.response型別
print(type(r.json())) #dict / list資料型別
print(type(data)) #返回str資料型別
r.text #http響應內容的字串形式，即：url對應的頁面內容 
r.content #http響應內容的二進位制形式

python中基本資料處理

def function a,b if a 0 b 0 return 只做夜班 elif a 0 b 0 return 只做白班 elif a 0 b 0 return 未做單 else return 混合 function x.夜間上班時長,x.日間上班時長 axis 1 例有某工廠工人上班時間...

python 資料處理之分箱操作

什麼是分箱？簡單點說就是將不同的東西，按照特定的條件放到乙個指定容器裡，比如水果把綠色的放乙個籃子裡，紅色乙個籃子等等，這個籃子就是箱，而水果就是資料顏色就是條件什麼樣式的資料要進行分箱資料主要分為連續變數和分類變數，分箱的操作主要針對於連續變數。為什麼要對資料進行分箱操作穩定性，時間複雜...

Python 資料處理

將檔案切分，存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...

python 資料處理基本操作 持續更新

python中基本資料處理

python 資料處理之分箱操作

Python 資料處理

相關推薦

python 資料處理基本操作持續更新