我對資料分析的初步理解

2021-08-30 15:34:27 字數 1291 閱讀 2663

今天我來講一下exce、vba、access、spss、xlstat、modeler和r語言這幾種軟體工具的區別。

一、excel

excel作為最基礎的資料分析工具,很多人主要用其來收集錄入資料。但是從專業分析的角度來看,excel的分析能力太弱了;資料透視表的功能還不錯,但幾乎沒有像樣的「統計」功能,圖形的功能也很弱。此外,雖然配備了陣列等比較高階的功能,能夠勉強地實現程式設計中「迴圈」的功能,但是當資料量比較大時,excel會變得很慢甚至不能忍受。

因此,當資料量不大時,以及你的需求不複雜是,excel完全可以勝任你的資料分析工作;反之,則其就不能勝任了。

二、vba

vba是由微軟公司將高階語言vb和其公司的office軟體整合而成。其功能之強大,以至於其可以完成幾乎所有資料分析的工作,比如聚類分析、關聯分析和主成分分析演算法。由於可以在excel中運用vba控制ppt和word,這大大提高了工作效率。在excel中運用vba處理完資料後,可以直接生成相應ppt和word檔案。

三、access

相比於已知的mysql和oracle這一些專業資料庫,由微軟公司提供的access資料庫只能算個「半吊子」。其相對於excel雖然操作靈活性不如excel,但是其的資料儲存量要高於excel。畢竟其是資料庫儘管其只是半專業性的。其在檢查資料一致性方面有優勢,因此效率特別高。相比於excel幾乎不支援多條件查詢其多條件查詢的效率很高。

四、spss

spss這裡指的是ibm spss statistics與下乙個ibm spss modeler (簡稱modeler)不同。但是他們都是專業的資料分析軟體。其優點和缺點都很明顯,優點是由美觀的介面和強大的功能。缺點由於其介面很繁雜再加之其是一款比較複雜的軟體,是的乙個擁有多年spss使用經驗的人都無法清楚其的具體使用方法,只能糊里糊塗地使用其。

五、modeler

modeler是專業的資料探勘軟體,它包含了關聯分析等著名的資料探勘演算法,而這些演算法是spss所不包含的。其顯著的優點完全圖示化。

六、xlstat

xlstat只是個基於excel環境下執行下小軟體或者稱其是excel的小外掛程式也不為過。因此其實用起來比較方便,能夠實現大多數統計分析的缺點,自然而然其缺點也就同excel一樣,當資料量比較大,其執行效果就變得差強人意了。

七、r語言

r由於其是開源的,這也就使得其近年來發展速度極快。但是若要學習其就必須要懂得一定的統計方面的知識。加之r有很多開發好的包,懂得這些統計包的專業人士在他們需要的時候可以將別人的這些包直接呼叫即可。另外,其的畫圖功能極其強大而且專業。

本文部分內容摘自與紀賀元老師的《資料分析實戰:基於excel和spss系列工具的實踐》一書中。

我對資料分析的初步理解

如何成為資料分析高手根據紀賀元老師的經驗之談,總結了一下幾點。第一,熟練度。對任何一門技術都講究 熟能生巧 只有你做的資料分析多了,自然而然也就熟練了,拿到了資料根據需求就能很快的做出合理的資料分析,並將結果很好呈現出來。第二,必須得掌握常用的資料分析工具。在這個資訊時代,出現了各種各樣的資料分析工...

資料分析的乙個初步理解

由乙個問題引發的思考 什麼是資料分析?資料分析目標就是使用原資料根據特定的目標進行資料預處理 挖掘建模,模型評價等的領域。要挖掘出來資料隱藏的有價值資訊。資料分析需要做些什麼?需要對原資料進行清洗 改錯等。使用適當的挖掘演算法達到目標。比如有某公司的客戶資訊,需要了解客戶的喜好 客戶的分類等,都要挖...

我對資料分析的一些看法(學習觀)

現在出去講課,客戶動不動就要求學習 用excel進行資料分析 這真是讓我很為難。首先,我個人認為,沒有哪台電腦是可以實現真正的 分析 功能,以前我常舉這樣乙個例子 某分店某月銷量突然發生大的變化,請電腦分析原因,然後電腦顯示器上就出現了 因為改變了激勵政策 這樣的字樣,那簡直不是電腦,是靈異事件 而...