Python資料分析 基礎介紹

2021-09-25 10:38:00 字數 2020 閱讀 5045

最首先,應該熟悉python基本語法:

接下來,只會涉及到一點和資料分析相關的基礎內容。

在python中數值只有兩個型別,不像其他語言會分的比較細,只有整數和浮點數,其他型別還有字串、布林值(true or false)、空值(none)

字串是用單雙引號定義的,單雙引號是等價的,但是注意,前後要一致(因為我報錯過,哈哈)

多行字串用三引號來定義。

字串也可以做加法,比如s=「hello」+「 」+「word」

python的索引和c++一樣是從0開始的。

字串的分割,用split函式。s.split() 指定分隔符(「,」)就在括號裡輸入,預設為空格。

檢視字串長度,len(s)

字串空值a="",len(a)輸出為0,數值空值a=none,輸出沒有結果。

運算子加減乘除就+ - * / 很普通了;%取模,返回除法的餘數;** 就是冪(2**3,2的3次方);//取整數,返回商的整數部分(向下取整)。

比較運算,返回的都是布林值。

==等於,!=不等於,<>這個也是不等於與!=類似,>大於,《小於,>=大於等於,<=小於等於。

賦值運算,c+=a,相當於c=c+a,同理,其他運算子一樣。

邏輯運算(a、b都為布林值)

aandb等價於a&b,只有ab都為true才輸出true,否則為false。

a|b等價於aorb,只有ab都為false,否則為true。

not,取反。

資料切片和取數類似,a[0:3],這樣相當於乙個左閉右開的區間,就是0、1、2都會取出來。a[:3]預設不寫也是從0開始的。a[0:]右邊不寫也就相當於預設取到最後乙個元素。a[0:-1]取到最後乙個元素的前乙個元素。間隔取數,b[2:9:3]從索引號2-索引號9的元素,每間隔3個取一次。

a[-7:],取最後7個,array([3, 4, 5, 6, 7, 8, 9])

a[-7 -1:-2],array([2, 3, 4, 5, 6, 7]),

a[-7 -2:],array([1, 2, 3, 4, 5, 6, 7, 8, 9])

a[-7 -2:-1],array([1, 2, 3, 4, 5, 6, 7, 8])

a[-n:]是選取a陣列最後n個元素形成陣列。而a[-n -x:-y]表示在形成的a[-n]陣列上向前多取x個元素,向後少取y個元素。

元組tuple,元組只要被初始化就不能修改了。一般用()

字典用來生成字典,字典裡的資料可以是任何型別,也可以是字典。

mvmv[「name」],則會輸出「肖申克的救贖」,檢視mv中所有的鍵值mv.keys(),則會輸出「name「,」actor「,同理value,items。

對name重新賦值,mv[「name」]=「鐵達尼號」,或者新增加也可以。mv.pop(「keys」)

集合,{}來生成集合,集合中不可以有相同元素。則輸出,檢視長度len(),新增元素a.add(),就可以了。交集a&b,並集a|b,做差a-b。

可變物件和不可變物件,列表,字典,集合都是可變的,元組,字串,整型都是不可變的。

型別轉換

浮點數轉為整數

int(3.14),輸出3

整數轉為浮點數

float(3),輸出3.0

檢視資料型別用type(a)

字串轉換成列表直接list(a)

轉成字串str(a)

python中是區分大小寫的

if語句,當有兩種情況的時候,用if else,當有三種情況的時候,if、elif x==0、else。

for迴圈 for i in [1,2,3,4,5]: print(i),輸出12345

while迴圈,i=1 while i<10: print(i) i=i+1

for i in [1,2,3,4,5]:

if i%==1:

print(i)

輸出1,3,5

列表生成式

list(range(1,11))左閉右開的形式,生成了1-10的列表

[x**2 for x in range(1,10)],輸出1,4,9,……,81

python基礎分析 資料分析 Python基礎

學python前要明確其使用目的。學python是為了進行資料分析,所以現階段最主要的任務是了解python的最基礎知識,然後通過運用python進行資料分析的專案,從而學會使用python。一 資料型別 1 整數 浮點數 字串 2 列表 list 2list.count obj 統計某個元素在列表...

python基礎資料分析

單樣本t檢驗 乙個連續變數與乙個數值的顯著性關係 sm.stats.descrstatsw a b ttest mean 0.1 0.1為引數 雙樣本t檢驗 乙個分類變數 二分類 與乙個連續變數的顯著性關係 方差齊性檢查 a1 creditcard exp a b 0 c a2 creditcard...

python資料分析基礎

python資料分析基礎 學資料分析之前應該明白整個資料分析的基本流程 1.明確需求與目的 2.資料收集 3.資料預處理 4.資料分析 5.編寫報告 假設檢驗,也稱為顯著性檢驗,是通過樣本的統計量,來判斷與總體引數之間是否存在差異 差異是否顯著 即我們對總體引數進行一定的假設,然後通過收集到的資料,...