壓縮度量矩陣對映

# 壓縮度量是乙個數學概念，例如我們採用歐氏距離作為度量方法，對於任意的 ||xi-xj||>||f(xi)-f(xj)|| (xi 和 xj 為樣本空間中的樣本)

#場景如果我們的樣本點之間距離很大，資料很稀疏的情況下，這種距離很大的計算是非常消耗資源的。我們不妨將空間的樣本對映的更加緊湊點，這樣計算資源的消耗也比較少。

import numpy as np

a = np.array([1, 1])

b = np.array([1, 6])

#我們需要用乙個矩陣將向量集中起來，我們設矩陣為a ||a-b||>||aa-ab||

# 如何構建乙個矩陣a？如果我們將a b 對映靠近他們的均值向量不就可以了？也就是a 將a,b 靠近(a, b)的均值向量

# 我們首先構建乙個假的均值向量 m =0.5 * 1/2(a + b) + 0.5 * a + nose(一點點高斯噪音) 從幾何數學來看這個點位於 a 和均值向量的正中間。 [a, b] = x, [m, m] = m ax = m -> a = mx^-1

x = np.array([[1, 1],

[1, 7]])

m = np.array([[1.1, 2.3],

[1.2, 2.1]])

# 有人說沒必要啊你這還求逆矩陣這不是畫蛇添足嗎？是的但是我們告訴大家度量學習資料很多是有標籤的，我們在nca方法中我們就是求得a矩陣，利用標籤資訊使得相同標記得資料更加得緊湊。在我們這裡多了乙個限制條件就是度量得結果比原來向量的度量結果要小。

#關鍵是a矩陣的構成是乙個很大的問題，這裡我只給出了很畫蛇添足的思路，但是中心思想是讓資料更加緊湊，必然度量的結果會比之前小。

dist1 = np.linalg.norm(a - b)

dist2 = np.linalg.norm(m[0] - m[1])

print(dist1)

print(dist2)

壓縮度量 矩陣對映