資料探勘學習筆記(四)

2021-10-02 22:16:18 字數 392 閱讀 1968

資料的屬性

1.資料物件

資料物件又稱為樣本、例項、資料點、物件或元組。

資料物件用屬性描述。

資料表的行對應資料物件,列對應屬性。

2.屬性(attributes)

3.屬性型別

二元屬性(binary attribute):布林屬性

序數屬性(ordinal attribute)

數值屬性(numeric attribute):定量度量,用整數或實數值表示。

比率標度(ratio-scaled)屬性

離散屬性vs連續屬性

離散屬性(discrete attribute)

連續屬性(continuous attribute)

資料探勘學習筆記四

1.星型結構 star schema 將事實表和維表進行連線 join 可以得到資料的值以及對資料的多維描述.2.雪花模型 snowflake schema 由 星型模型 演變來的,某些維表是規範化的,以便減少冗餘.3.星座模型 在星型模型的基礎上,具有多個事實表.4.雪暴模型 在星座模型的基礎上,...

web資料探勘(學習筆記) 觀點挖掘

觀點挖掘 1.主要挖掘非結構化的文字,涉及自然語言處理技術 2.網路已經顯著改變人們表達觀點的方式,使用者生成的內容已經成為 的一種形式 3.主要研究三方面的觀點挖掘的任務 意見分類 基於特徵觀點挖掘和摘要 比較句子和比較關係挖掘 4.意見分類 文件層次上分類,將評價分類到正面,或者負面。當前大多研...

資料探勘學習筆記 3

常見的資料融合方法有 靜態的融合方法,如加權最小平方等 動態的融合方法,如遞迴加權最小平方 卡爾曼濾波 小波變換的分布式濾波等 基於統計的融合方法,如馬爾可夫隨機場 最大似然法 貝葉斯值等 基於資訊理論演算法的方法,如聚集分析 自適應神經網路 表決邏輯 資訊熵 基於模糊集理論的聚類方法等。資料清理的...