七周速學資料分析(統計學篇)

2021-09-02 23:24:35 字數 942 閱讀 6514

前面我們為大家講述了excel、資料視覺化、資料分析思維、資料庫的知識。學會了這些就相當於學會了資料分析一般的內容,但是這些知識並不能構成乙個完整的資料分析知識體系,還需要學習統計學、python/r以及業務知識,現在就給大家講解一下統計學的知識。

就目前而言,很多資料分析師統計學基礎知識並不是很重視,這是一種錯誤的做法,在資料分析知識中,統計學的地位也是不容忽視的,如果在分析資料的時候沒有了統計學,那麼分析資料就不那麼準確了。如果相關人員不清楚某種事物的置信度的含義和概念,那麼就不能夠分析出乙個完整的資料。如果不了解統計學的資料分析師,往往是乙個粗糙的分析師。如果你想要往機器學習發展,那麼統計學更是需要掌握的基礎。

很多人都喜歡用平均數去分析乙個事物的結果,但是這往往不是準確的,如果學習了統計學,那麼我們就能夠以另乙個角度看待資料。畢竟很多資料分析的決策並不牢靠。我們統計學裡面還需要學習描述統計中的諸多變數,比如平均數、中位數、眾數、分位數、標準差、方差。這些統計標準會讓新手分析師從平均數這個不靠譜的泥潭中出來。

如果將統計學和資料視覺化相結合,那麼這就是對資料的分布進行乙個直觀的概念講解。這是因為很多特定的模型都有自有的資料分布圖,這些分布圖有很多,比如直方圖和箱線圖,如果掌握了這些分布圖的好處,那麼就是對資料分析有極大的幫助。由此可見,直方圖和箱線圖會是長久伴隨分析師的利器。

要學好統計學,或者要利用好統計學,那麼一定要重視概率論的研究,統計學的一大重要分支是概率論,概率是度量一件事發生的可能性,它是介於0到1之間的數值。很多事情,都可以用概率論解釋,概率論包括貝葉斯公式、二項概率、泊松概率、正態分佈等理論。這些理論在資料分析中都會用得到。

由此可見,統計學是乙個很廣闊的領域,涉及到各方各面,尤其是包括方差分析,時間序列等,都有各自不同的應用。大家在學習的時候一定要重視統計學的知識,這樣才能夠將資料分析的知識學的十分透徹。

七周速學資料分析(資料分析思維篇)

大家都知道,人們的智商都是不相同的,這是因為人們的思維方式不同,對於工具技能的掌握並不代表著智商高,取決人們的智商高的標準就是看人的 思維程度是否高階,在前面的內容我們提到了excel和資料視覺化的技能,但這些都是工具,不是思維,今天我們就給大家講解一下如何培養資料分析思維。資料分析思維就是決定資料...

七周速學資料分析(資料視覺化篇)

前面我們提到了資料分析中的excel技能,excel技能是資料分析知識的基礎,只能夠分析簡單小型的資料,但是在資料分析中,我們應給意識到乙個問題,那就是我們盡量使用圖表的方式代替文字表達,這是因為人們對於圖表表達的直觀度比文字表達的直觀度要高,所以也就有了怎麼一句話,那就是字不如表,表不如圖。所以我...

七周速學資料分析(資料視覺化篇)

前面我們提到了資料分析中的excel技能,excel技能是資料分析知識的基礎,只能夠分析簡單小型的資料,但是在資料分析中,我們應給意識到乙個問題,那就是我們盡量使用圖表的方式代替文字表達,這是因為人們對於圖表表達的直觀度比文字表達的直觀度要高,所以也就有了怎麼一句話,那就是字不如表,表不如圖。所以我...