12 20學習筆記 資料視覺化小練習

2021-10-01 14:50:00 字數 3228 閱讀 9267

主要用於處理一些資料

以讀取csv檔案為例

from matplotlib import pyplot as plt

import pandas as pd

x=pd.read_csv(

'/users/蔡洪浩/desktop/countries.csv'

)#y=x[10]

y=x.country==

'china'

#print(y) bool值型別

#z=x[y] 如果y是真則輸出z,也就是把國家為china的全部輸出

#print(z)

z=x[2:10]

#利用切片的知識可以把2到10的所有資訊輸出

print(z)

再用上畫圖各種胡搞

from matplotlib import pyplot as plt

import pandas as pd

x=pd.read_csv(

'/users/蔡洪浩/desktop/countries.csv'

)#y=x[10]

china_data=x.country==

'china'

china=x[china_data]

us_data=x.country==

'united states'

us=x[us_data]

#上面分別把兩個國家的資料存起來

#print(y)

#z=x[y]

#print(z)

#print(x.year[2:10])

plt.plot(china.year,china.population/10**8,label=

'china'

)#這裡10**8就是避免y軸出現科學計數法,下同

plt.plot(us.year,us.population/10**8,label=

'us'

)#plt.plot(china.year,china.population/china.population.iloc[0],label='china')

#plt.plot(us.year,us.population/us.population.iloc[0],label='us')

#這種除以自己第一年的人數就是反應的增長率的問題

#iloc函式就是調出某一行的資料

plt.legend(

)#print(z)

from matplotlib import pyplot as plt

import pandas as pd

pd.set_option(

'display.max_row',100)

pd.set_option(

'display.max_columns',100)

#不想看到省略號,相當於設定行距之類的

#users=['a','b','c','d']

df=pd.read_csv(

'/users/蔡洪浩/desktop/diabetes.csv',index_col=0)

#df=pd.read_csv('/users/蔡洪浩/desktop/diabetes.csv',index_col=0,names=users)

#把開頭的序號變成名字

#就可以使用print(df['a']) 就是把a那一列輸出

#也可以使用print(df.a) 但是有時候會出錯

#甚至可以用print(df.a+','+df.c) 就是把兩列數字並行輸出

#df['new name']=df.c+df.a 這個表示的是把我們新生成的資料插入到df中。便於我們來進行對比。

#index_col =0 取消前面的序號

#print(df.describe()) 那道資料的第一步,看總體資料的描述

print(df)

#print(df.head())

#plt.scatter(df.glucose,df.bloodpressure)

#plt.hist(df.bloodpressure)

from matplotlib import pyplot as plt

import numpy as np

v=np.array(

[1,23,4,5,723,12,4]

)v1=np.array(

[[1,2,4,55,1],

[1,1,1,1,1]])

#list 向矩陣的轉換

#後者為二維矩陣

#print(type(v))

#print(v1)

#k=[0,4]

#j=[np.arange(2),k] +=100

#print(np.arange(2))

#arange(x) 就是生成0-1的數字

#print(j)

#矩陣的加法

#print(v[v>3])

#輸出v矩陣中大於3的數字

from matplotlib import pyplot as plt

import numpy as np

v=np.array(

[1,23,4,5,723,12,4]

)v1=np.array(

[[1,2,4,55,1],

[1,1,1,1,1]])

# 生成乙個行列相等的數字

# 他們之間的加減法就是對應的行列相加減

#舉乙個加法為例子

x=np.array(

[[1,2],[3,4]])

y=np.array(

[[2,4],[7,9]])

#print(x+y)

#開方#print(np.sqrt(x))

print(np.dot(x,y))

#點乘#print(x.dot(y))

#print(np.sum(x))

#print(np.sum(x,axis=1))

#axis =1 的時候就是求列的和

#print(x.t)

#矩陣的轉置

y=empty_like(y)

#行列一樣生成的隨機矩陣

for i in range(2):

z[i,:]

=x[i,:]+y

#z矩陣的每一行都加y(進行的是矩陣的加法!!)

12 19學習筆記 資料視覺化

前奏 import matplotlib.pyplot as plt x 1,2,3 x1 2,3,4 y 1,2,3,4,5 z com a com b com c z1 com a com b com c plt.bar z,x,label bar 1 color red 柱狀圖 plt.bar...

筆記 資料缺失視覺化

coding utf 8 匯入warnings包,利用過濾器來實現忽略警告語句。import warnings warnings.filterwarnings ignore import pandas as pd import numpy as np import matplotlib.pyplot...

讀書筆記資料科學入門 視覺化資料

資料視覺化是資料科學家的重要部分。建立視覺化的目的 探索資料,交流資料。本章利用乙個外接的matplotlib庫的配置進行視覺化的初步了解 許多任務具可以視覺化資料,目前應用很廣的是matplotlib庫,在windows下配置該模組稍微比較麻煩,下面會一步一步講解 matplotib 是pytho...