機器學習中常用的python小知識(一)

2021-09-12 19:05:33 字數 1155 閱讀 7562

在機器學習中python現在已經成為主流語言,但是想要快速去實現演算法還需要磨磨刀。

python工具磨刀石。

主要用的庫有numpy、pandas、matplotlib以及我推薦的乙個畫統計圖的庫seaborn。下面我以我用到的順序,具體說明一下這些小工具的用法。

讀取檔案

file=open('data.txt',r)

data=file.read()

或data= pd.read_csv('data.txt', header=none,names=['xx', '***'])

可以看出pandas的讀取功能更加強大 

建立資料表

datasheet=data.dataframe(,)

刪除某一列

datasheet=datasheet.drop('one',axis=1)

或del datasheet['one']

插入某一列

datasheet=datasheet.insert(0,'zero',1)#三個引數位置、名稱、內容

合併兩列表

data=datasheet

data=pd.concat([data,datasheet],axis=1)#axis=0是行、1是列

資料提取

通過行列號提取

提取行:data.iloc[0]

提取列:data.iloc[:,[0]]

提取整塊:data.iloc[1:5,1:3]#[1,2,3,4]x[1,2]的整塊

資料自定義函式

#預設以列為單位的normal

#對列中的每乙個引數進行遍歷操作

畫點函式

plt.scatter(x,y,s,c,marker)

#點座標x,y 點大小s 

#c顏色,marker形狀

畫線函式

plt.plot(x,y, label)

#點座標x,y圖例label

有了這幾個基本函式,我們來試一試可以去完成一些機器學習演算法了

機器學習中常用距離的小結

設有兩個n維向量a x11,x12,x1n 和b x21,x22,x2n 1 曼哈頓距離 曼哈頓距離也稱為城市街區距離,數學表示式為 2 歐氏距離 歐氏距離就是我們熟悉的l2範數,數學表示式為 3 閔可夫斯基距離 閔可夫斯基距離可以看作歐氏距離的一種推廣,數學表示式為 可以看到,當p值取1時,閔可夫...

機器學習 深度學習中常用的Linux命令

作為一名coder,linux命令是基本生存技能,但linux的命令何其多,要想完全掌握可不易。在我平常的學習和工作中,linux伺服器主要是用來跑ml dl 的 linux運維大神請略過 因此本文將主要從跑 的角度 一下常用的linux操作。告別手指抽筋的方向鍵 ctrl e 游標回到行末 ctr...

機器學習中常用的矩陣求導公式

機器學習中常用的矩陣求導公式 矩陣求導好像讀書的時候都沒學過,因為講矩陣的課程上不講求導,講求導的課又不提矩陣。如果從事機器學習方面的工作,那就一定會遇到矩陣求導的東西。維基百科上 根據y與x的不同型別 實值,向量,矩陣 給出了具體的求導公式,以及一堆相關的公式,查起來都費勁。其實在實際的機器學習工...