Item2Item中為什麼可以用歐式距離衡量相似度

2021-08-19 08:50:08 字數 376 閱讀 5263

如果是這樣想的,那麼對於這個問題你還是知其然不知其所以然。

俗話說,吃一塹,長一智。總結一下兩個原因,更詳細的去知乎尋答案吧。

1.首先,用歐式距離來計算item之前的相似度,不是直接計算item 打分矩陣的歐式距離,而是,需要先對item的特徵進行歸一化,保證各個維度是在相同的刻度級別上取值及相同刻度級別上影響相似度。舉個簡單栗子:通過身高和體重衡量兩個人體型相似度,總不能說路人a(身高158,體重90)和路人b(身高168,體重100)是身材完全一樣的人吧;

2.重點:用歐式距離衡量相似度有乙個假設前提,假設各個維度對相似度的影響是一致的(個人覺得這是比較重要的原因)

若有錯誤或者更好的回答,歡迎指正。

Scrapy中的item是什麼

這兩天看scrapy,看到item這個東西,覺得有點抽象,查了一下,有點明白了。item 是儲存爬取到的資料的容器 其使用方法和python字典類似,並且提供了額外保護機制來避免拼寫錯誤導致的未定義字段錯誤。爬取的主要目標就是從非結構性的資料來源提取結構性資料,例如網頁。scrapy提供 item ...

Scrapy中的item是什麼

這兩天看scrapy,看到item這個東西,覺得有點抽象,查了一下,有點明白了。item 是儲存爬取到的資料的容器 其使用方法和python字典類似,並且提供了額外保護機制來避免拼寫錯誤導致的未定義字段錯誤。爬取的主要目標就是從非結構性的資料來源提取結構性資料,例如網頁。scrapy提供 item ...

python中7 3為什麼等於 2?

python計算取模的方法是 比如a b 先算出a除去b的值,然後將其下取整,然後把b乘回來,然後從a當中扣掉這個值 所以整個式子就是a b a b floor a b 那我們按這樣算一遍,7 3 7 3 floor 2.333 7 3 3 2.333向下取整 3 7 9 2 不同語言對取模有不同的...