資料探勘 tip

2021-09-08 15:54:50 字數 702 閱讀 9640

從技術層面來說,按照資料探勘產出的知識可以粗分為兩大類:描述型挖掘和**型挖掘

描述型挖掘是對現有資料的進一步精煉和歸納,從中抽取中更巨集觀的反映資料特徵的概念描述。舉個例子來說,某家銀行有幾百萬客戶,資料倉儲中儲存了每個客戶的人口統計資訊、賬戶資訊、交易資訊、客服聯絡資訊等詳細資料。但是銀行不可能清楚地了解每位客戶是什麼樣的客戶,客戶的消費模式到底是怎樣的?這時一般需要把全體客戶進行細分,劃分為幾個客戶群,而且這種劃分可以保證具有相似行為、相似價值的客戶會被放入同乙個群組中。有了這些客戶群,銀行就能更容易地發現營銷機會並制定營銷戰略。這個例子中所用的挖掘技術是聚類模型,它就是一種典型的描述型挖掘。

**型挖掘,顧名思義,就是建立的挖掘模型具備**能力。這種**能力可能包括**哪些客戶下個月會流失,哪些客戶對**活動會積極響應,哪些客戶的未來價值會成長以及成長多少等等。**型挖掘常常對企業運營具有更強的指導作用,從而更快地見效。

一般來說,常用的資料探勘技術包括:

用於客戶細分的聚類演算法,

用於交叉銷售的關聯分析和序列分析演算法,

用於客戶價值分析、流失分析、交叉銷售的決策樹、神經網路和回歸等**演算法,

用於網際網路的文字挖掘和web分析等等

Mysql資料庫技術Tip

1.varchar n 中的n代表的是字元數,而不是位元組數 使用utf8儲存255個漢字 varchar 255 765個位元組。過大的長度會消耗更多的記憶體。2.避免使用text blob資料型別,最常見的text型別可以儲存64k的資料。建議把blob或是text列分離到單獨的擴充套件表中。m...

SPSS Modeler資料探勘 資料探勘概述

資料探勘 是一種通過數理模式來分析大量資料,以找出不同的客戶或市場劃分,分析出消費者喜好和行為的方法。可以描述為 是按企業既定業務目標,對大量的企業資料進行探索和分析,揭示隱藏的 未知的 或驗證已知的規律性,並進一步將其模型化的先進的有效的方法。資料探勘 data mining 在技術上的定義是從大...

資料探勘 資料

對關注的屬性,樣本與原始資料集有相同的性質,則用抽樣計算的結果與全集是一樣。1.1 抽樣的方法 1 簡單隨機抽樣 random sampling 放回 不放回 2 分層抽樣 stratified sampling 如果資料集不同型別的資料數量差異過大,則隨機抽樣會丟失數量少的樣本。可針對不同資料組,...