機器學習 周志華 個人練習9 6

2021-07-31 20:46:11 字數 946 閱讀 1351

根據定義,如上圖所示,最大和最小距離分別代表聚類簇i與j間距離最近的樣本點或距離最遠樣本點之間的距離,而其具體幾何含義是什麼呢?根據個人的理解,參考了icefire的回答但有一些不同看法,我用維基百科上關於hausdorff distance的示意圖進行表示。

如下圖所示,圖中左下方的黑色虛線代表hausdorff距離,而黑色實線代表dm

in,灰色實線代表dm

ax,顯然這些距離都滿足對稱性。

對於對於dm

in,我們可認為是以

y 集合中所有點為圓心同時向外不斷擴大的圓,當第乙個圓開始接觸到集合x中的點,也就是形成第乙個外切圓時所對應的半徑即為dm

in。 對於dm

ax,我們也認為是以

y 集合中所有點為圓心同時向外不斷擴大的圓,隨著圓擴大,當最後乙個圓能夠完全包含

x時的圓半徑即為dm

ax。同時,由對稱性可知,反過來,以

x 集合中所有點為圓心,使圓半徑同時不斷擴大,那麼達到這個dm

ax時對應的條件是:最後乙個圓的半徑擴大到恰好同時包含了

x 和

y中所有樣本,成為外接圓。綜上所述,dm

ax就是在乙個集合上,以所有點為圓心形成不斷向外擴大的圓,在所有圓中最晚形成能夠完全包住另一集合中所有樣本的外接圓時對應的半徑即為dm

ax。

順帶一提,正如icefire所表示的,hausdorff距離就是以y(

x)集合中所有點為圓心同時向外不斷擴大的圓,當最後乙個圓開始接觸到集合x(

y)中的點,也就是形成最後乙個外切圓時所對應的半徑中的較大者即為hausdorff距離。

機器學習 周志華 個人練習13 10

根據題意可知,我們的目的是檢測將xi 劃入聚類簇cr 是否會違背m與 c 中的約束。在這裡不能只簡單考慮該樣本是否滿足與某些約束條件內樣本的 必連 和 勿連 條件,而是需要分析到底是待聚類樣本違約還是其約束集合中的樣本存在違約,同時需要考慮必連樣本的傳遞性。對於必連樣本,考慮如下圖1的情況,左右兩圖...

機器學習周志華筆記

1,監督學習 分類 回歸 無監督學習 聚類 2,決策樹 根據資訊增益的大小來確定節點 資訊熵 描述事務確定性程度的值 需要多少個bit來描述資訊 ent d pklog2pk 資訊增益 資訊熵 某個屬性劃分的平均資訊熵 該屬性劃分純度 3,支援向量機中對超平面的理解 劃分超平面用以下線性方程表示 w...

周志華 機器學習 筆記

學習演算法自身的歸納偏好與問題是否相配,往往會起到決定作用。對於上面這句話 你的輸入資料被怎麼處理,最終得到什麼結果,我認為偏好指的就是這個處理的過程。線性非線性?那些feature忽略掉?怎麼利用這些資料?更具體一些,你用網路處理,還是傳統方法,資料的分布和你的處理方法相符嗎?沒有免費的午餐定理 ...