20161230 資料分析入門01

2021-07-25 17:19:00 字數 633 閱讀 4011

1.比例vs比率。比例是指在總體中各部分的數值佔全部數值的比重,通常反映總體的構成和結構。比率是反映乙個整體中各部分之間的關係。

2.同比是歷史同時期進行比較得到的數值,該指標主要反映的是事物發展的相對情況;環比是指與前乙個統計期比較得到的數值,該指標主要反映的是事物逐期發展的情況。

3.資料清洗工作。(1)重複資料的處理:函式(excel中的countif)、高階篩選、條件格式(excel 2010,「開始」、「條件格式」、「突出顯示單元格規則」、「重複值」)、資料透視表。(2)缺失資料處理:定位輸入(「開始」、「編輯」、「定位條件」)、用乙個樣本統計量代替缺失值、用乙個統計模型算出來的值進行替換、將有缺失值記錄刪去、將有缺失值的記錄值保留但在不相應分析中做必要排除。(3)檢查資料邏輯錯誤:if函式、條件格式標記錯誤。

4.資料抽取:字段分列、字段合併、字段匹配。

5.資料轉換:行列互換(選擇性貼上),多選錄入方式轉換。

6.資料分析方法:對比分析法(與目標對比、不同時期對對比、同級部門單位地區對比、業內對比、活動效果對比);分組分析方法;結構分析法(分析總體內的各部分與總體之間進行對比的分析方法,即總體內各部分佔總體的比例);平均分析法(運用計算平均數的方法來反映總體在一定時間、地點條件下某一數量特徵的一般水平);交叉平均法(通常用於分析兩個變數之間的關係)。

資料分析入門

2018年6月14日筆記 用適當的統計分析方法對收集來的大量資料進行分析,將他們加以彙總和理解並加以消化,以求最大化的開發資料功能,發揮資料的作用。資料分析可用於現狀分析,原因分析,分析。明確分析目的和思路 資料收集 資料處理 資料分析 資料展現 報告撰寫 明確分析目的之菜鳥與分析師對比 菜鳥想法....

資料分析入門 IPython入門

ipython的開發者吸收了標準直譯器的基本概念,在此基礎上進行了大量的改進,創造出乙個令人驚奇的工具。在它的主頁上是這麼說的 這是乙個增強的互動式python shell。具有tab補全,物件自省,強大的歷史機制,內嵌的源 編輯,整合python偵錯程式,run機制,巨集,建立多個環境以及呼叫系統...

從QC看資料分析 入門資料分析

在資料分析的道路上越走越遠 陰差陽錯的做了資料分析,而且一開始我還不知道自己在做的是資料分析,看了很多資料分析的書,也走了一些彎路,做了很多實踐專案,突然很想把自己作為乙個小白的資料分析之路的成長過程寫下來。因為最近恰好在了解qc相關的東西,然後發現qc的套路居然能對標資料分析的過程,尤其是qc中各...