《BI那點兒事》Microsoft 神經網路演算法

microsoft神經網路是迄今為止最強大、最複雜的演算法。要想知道它有多複雜，請看sql server聯機叢書對該演算法的說明：「這個演算法通過建立多層感知神經元網路，建立分類和回歸挖掘模型。與microsoft決策樹演算法類似，在給定了可**屬性的每個狀態時， microsoft神經網路演算法計算輸入屬性每個可能狀態的概率。然後可以用這些概率根據輸入屬性**被**屬性的輸出。」

什麼時候用這個演算法呢？推薦在其他演算法無法得出有意義的結果時再用，如提公升圖輸出的結果。我們經常把microsoft神經網路作為「壓箱底」的最後一招，在其他演算法處理巨大而複雜的資料集無法得到有意義的結果時才使用它。這個演算法可以接受discrete或continuous資料型別作為輸入。在大型資料來源上使用microsoft神經網路之前，一定要用生產級別的負載好好測試，因為處理這類模型的開支太大了。同其他演算法一樣，在「演算法引數」對話方塊中也有多個引數可以配置。同其他一些開支比較大的演算法一樣，只有在業務理由非常充分的情況下才有必要修改預設值。

microsoft神經網路演算法的乙個變體是microsoft邏輯回歸演算法。

下面我們進入主題，同樣我們繼續利用上次的解決方案，依次步驟如下：

資料來源檢視：

鍵：序列

輸入：統率、武力、智力、政治、魅力

可**：身分

資料內容型別：

continuous（連續型）：統率、武力、智力、政治、魅力

discrete（離散型）：身分

建模完成，產生資料探勘結構介面包含mining structure（挖掘結構）、mining models（挖掘模型）、mining model viewer（挖掘模型檢視器）、mining accuracy chart（挖掘精確度圖表）以及mining model prediction（挖掘模型**）；其中在mining structure（挖掘結構）中，主要是呈現資料間的關聯性以及分析的變數。

挖掘模型：

在mining models（挖掘模型）中，主要是列出所建立的挖掘模型，也可以新增挖掘模型，並調整變數，變數使用狀況包含ignore（忽略）、input（輸入變數）、predict（**變數、輸入變數）以及predict only（**變數），如圖所示。

在挖掘模型上點選滑鼠右鍵，選擇「設定演算法引數...」可修改模型引數設定，如圖所示

其中包含：

hidden_node_ratio：指定用於判斷隱藏層中的節點數目。隱藏層內的節點數計算公式為：hidden_node_ratio *sqrt（ * ）。

holdout_percentage：指定用於計算測試組**錯誤的百分比，作為停止準則的一部分。

holdout_seed：指定用於隨機產生測試組的種子資料。如果未指定，演算法會依據模型名稱產生隨機種子，以保證在重新處理模型時保持測試組相同。

maximum_input_attributes：指定演算法可處理的最大輸入變數數目。將此值設定為0，會停用輸入變數。

maximum_output_attributes：指定演算法可處理的最大輸出變數數目。將此值設定為0，會停用輸出變數。

maximum_states：指定演算法所支援變數取值狀態的最大數目。如果屬性狀態數大於該值，演算法會擷取最常用的狀態，並將超過最大值的其餘狀態視為遺漏。

sample_size：指定用來訓練模型的案例數目。演算法會取小於以下兩者：sample_size或total_cases *（1-holdout_percentage/100）。

挖掘模型檢視器：

「挖掘模型檢視器」展示該挖掘模型的結果，通過通過柱狀圖表示某一變數的取值狀態對**變數影響的方向和大小。

提公升圖：

分類矩陣：

microsoft 神經網路演算法

《BI那點兒事》Microsoft 神經網路演算法

《BI那點兒事》Cube的儲存

《BI那點兒事》META DATA（元資料）

《BI那點兒事》資料流轉換透視

《BI那點兒事》Microsoft 神經網路演算法

《BI那點兒事》Cube的儲存

《BI那點兒事》META DATA（元資料）

《BI那點兒事》資料流轉換 透視

相關推薦

《BI那點兒事》資料流轉換透視