資料分析筆記

2022-05-03 15:21:19 字數 590 閱讀 2383

1,資訊幾乎都是用於兩個目的:操作型記錄的儲存和分析型決策的制定。簡單說,操作性系統儲存資料,而dw/bi系統使用資料。

2,同比環比從定義上來說很簡單,吳捷的答案說的很清楚了,我來補充一下兩者的適用範圍:

同比是今年的某個階段與去年的相同時段比較,適用於觀察某個指標在不同年度的變化,優勢是可以去除大多數業務的季節因素,比如招聘,2月是淡季,3月是旺季,做3月的分析時用環比實際上體現出的是招聘市場的變化,而不是公司銷售額的變化,用同比則可以看出今年的增長情況;劣勢是靈活性較低,因為同比大多數以年為單位(否則就達不到去除季節因素的目標),不能反映出資料的短期大量變化。

環比是某個階段與其上乙個時長相等的階段做比較,比如上週和本週,上月和本月,上季度和本季度等等,用於表示資料的連續變化趨勢,優勢是對於高速增長型業務,能非常好的體現出業務的增長趨勢和事件的影響(典型如新開**流量,uv第一周100,第二週300,第三週500,第四周做了個活動,2000,第五周1000,那麼前三周**的使用者增長趨勢很好,第四周資料有個突增,能看到活動帶來的增長是很明顯的),劣勢是光看數字難以排除季節性因素,且對於穩定波動型資料(例如部門人數,每月有進有出,一年內的走勢不明確,但部門規模又逐年擴大)來說,趨勢不明顯,環比意義相對小。

資料分析筆記

資料分析的步驟 明確問題 理解資料 資料清洗 資料分析或建模 視覺化 資料分析的好習慣 資料清洗的步驟 套路 選擇所要用到的子集 刪除重複值 缺失值處理 一致化處理 資料排序 異常值處理 一致化處理 的意思是,例如有些欄位中的資料,格式不一樣,那麼就要對這些資料進行處理,讓他們的格式一致化,例如日期...

資料分析學習筆記

資料分析的常規步驟 1.確定問題 2.分解問題 3.評估問題 4.制定相應的決策 用一句話概括就是 現有的資料能否解決現在的問題,分析問題的瓶頸所在,評估分析的方式方法,找到最合理的資料分析方案進行實施。資料分析的模型沒有統一的模型,每乙個公司都有自己的業務線跟使用者群裡,使用者的屬性不同,行為軌跡...

Python資料分析筆記

數值型字元型 資料結構 取值 true 真 false 假 運算規則 與 一假為假,兩真為真 true true true false false false 或 兩假為假,一真為真 true true true false false falsenot 非 非真為假,非假為真 not true n...