Python資料分析幾個比較常用的方法

解決方法：python的版本問題！換成python3就自動解決了！當然也有其他的方法，這裡就不再深究

需求情況：有的時候，資料很多，但是只要僅僅對部分列的資料進行分析的話，要怎麼做？

解決方法：

df = pandas.read_excel('1.xls',sheetname= '店鋪分析**')

一行讀取資料，第二行訪問指定列

需求情況：有乙個**，裡面的列是單價，數量，想再輸出乙個總價的列，或是對一些資料進行總結

解決方法：直接上**

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

#把計算結果新增為乙個新的列

df['result'] = df.price*df.num #新的列名，後面是對應的數值

print (df)

需求情況：比較蛋疼的乙個情況，電商很多資料都是百分比的，帶有百分號，不能進行直接的計算，需要對其進行轉換，然後再輸出

解決方法：

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

f = df['跳失率'].str.strip("%").astype(float)/100;

f.round(decimals=2) #保留小數點後面2位

df['跳失率'] = f_str #重新賦值

需求情況：有的時候需要寫乙個通用指令碼，比如隨機抽樣分析，程式自動獲取行和列的話，寫出來的指令碼通用性明顯會很強

解決方法：

df.columns.size #獲取列數

df.iloc[:, 0].size #獲取行數

需求情況：這個就不用說了，到處都要用到

解決方法：

df['跳失率'].size #對資料進行排序

newdf = df.sort(['**量', '帶來的訪客數'], ascending=[true, false]); #多重排序

需求情況：同樣，十幾列的資料，如果你想獲取指定的輸出資料，可以用方法2，但是如果想要獲取的資料列比較多，只有1-2行不想要，這樣就可以用指定刪除列的方法了

解決方法：

df.columns.delete(1)

一行**搞定！

總結：整體來說的，python的語法在做資料分析還是相當簡單的，很多的需求基本上就是一行**搞定！

python 資料分析幾個重要點

lambda 函式有些函式只要用幾次就需要定義乙個新函式，你是否對此感到厭煩呢？lambda函式可以解決這個問 lambda函式通常被用來構建應用次數比較少的匿名函式，也就是構建乙個不帶名字的函式。lambda函式基本語法如下 lambda argument expression普通函式能做的,l...

python資料分析的幾個基本庫

資料科學領域五個最佳python庫 numpy scipy pandas matplotlib scikit learn numpy n維陣列矩陣快速高效，向量數算高效的index，不需要迴圈開源免費跨平台，執行效率足以和c matlab媲美 scipy 依賴於numpy 專為科學和工程設...

Python資料分析之pandas比較操作

比較運算子用於判斷是否相等和比較大小，python中的比較運算子有六個，pandas中也一樣。在pandas中，dataframe和series還支援6個比較方法，詳見下表。方法英文全稱用途程式設計客棧 eqequal to 等於ne not equa to 不等於lt less than 小於...

Python資料分析幾個比較常用的方法

python 資料分析幾個重要點

python資料分析的幾個基本庫

Python資料分析之pandas比較操作

相關推薦