資料探勘建模的標準流程是什麼,主要分為哪幾步?

2021-09-11 10:35:04 字數 968 閱讀 6104

資料探勘建模的標準流程,同時亦稱為跨產業資料探勘標準作業程式,資料探勘主要分為商業定義、資料理解、資料預處理、建立模型、實施六步,各步驟的敘述說明如下:

1.定義商業問題,資料探勘的中心價值主要在於商業問題上,所以初步階段必須對組織的問題與需求深入了解,經過不斷與組織討論與確認之後,擬訂乙個詳盡且可達成的方案。

2.資料理解,定義所需要的資料,收集完整資料,並對收集的資料做初步分析,包括識別資料的質量問題、對資料做基本觀察、除去雜訊或不完整的資料,可提公升資料預處理的效率,接著設立

假設前提。

3.資料預處理,因為資料來源不同,常會有格式不一致等問題。因此在建立模型之前必須進行多次的檢查修正,以確保資料完整並得到淨化。

4.建立模型,根據資料形式,選擇最適合的資料探勘技術並利用不同的資料進行模型測試,以優化**模型,模型愈精準,有效性及可靠度愈高,對決策者做出正確的決策愈有利。

5.評價和理解,在測試中得到的結果,只對該資料有意義。實際應用中,使用不同的資料集其準確度便會有所差異,因此,此步驟最重要的目的便是了解是否有尚未被考慮到的商業問題盲點。

6.實施,資料探勘流程通過良性迴圈,最後將整合過後的模型應用於商業,但模型的完成並非代表整個專案完成,知識的獲得也可以通過組織化、自動化等機制進行**應用,該階段包含部署計畫、監督、維護、傳承與最後的報告結果,形成整個工作迴圈

人工智慧、大資料、雲計算和物聯網的未來發展值得重視,均為前沿產業,多智時代專注於人工智慧和大資料的入門和科譜,在此為你推薦幾篇優質好文:

資料統計分析和資料探勘有何區別?

資料探勘的聚類演算法和優勢

如何通過自學,成為資料探勘「高手」?

資料分析與資料探勘的區別和聯絡?

構建乙個資料探勘模型,主要分為哪幾步?

多智時代-人工智慧和大資料學習入門**|人工智慧、大資料、物聯網、雲計算的學習交流**

資料探勘 模型的衡量標準與建模

2 ease of use 是否好用 3 feature selection 二 模型分類 2 分類問題 3 聚類問題 一般來說,建模是迴圈做的。準確性accurate 穩定性stable 對同乙個樣本的 值是唯一的,穩定的 推廣性general 建模使用的資料決定了模型的推廣性。generate ...

CRISP DM(跨行業資料探勘標準流程

跨行業資料探勘標準流程 crisp dm cross industry standard process for data mining 此kdd過程模型於1999年歐盟機構聯合起草.通過近幾年的發展,crisp dm模型在各種kdd過程模型中佔據領先位置,採用量達到近60 資料引自ciosandk...

資料探勘的流程

資料探勘環境 資料探勘是指乙個完整的過程,該過程從大型資料庫中挖掘先前未知的,有效的,可實用的資訊,並使用這些資訊做出決策或豐富知識.資料探勘環境可示意如下圖 7.2資料探勘過程圖 下圖描述了資料探勘的基本過程和主要步驟 資料探勘的基本過程和主要步驟 7.3 資料探勘過程工作量 在資料探勘中被研究的...