程式設計師面試金典 17 26

2021-10-08 18:51:18 字數 1876 閱讀 3665

sparse similarity:給定一些整數集合,計算集合之間的稀疏相似度。稀疏相似度定義為交集大小和並集大小的比值。

假設有s個集合,每個集合中有n個整數。最簡單的方式就是對於每一對集合,查詢第乙個集合中有多少元素在第二個集合中,這樣就算出了交集的大小,最後根據容斥原理計算並集的大小即可。這種方法的時間複雜度為o(s ^ 2 * n ^ 2);如果查詢過程用set,那麼複雜度降為o(s ^ 2 * nlogn);如果查詢過程用unordered_set,那麼複雜度降為o(s ^ 2 * n)。根據題幹sn的輸入規模都會達到5003次方的演算法應該是會超時的。

再來降低一下複雜度,也就是優化一下o(s ^ 2)的部分。如果不想兩兩全部比較,那就爭取只處理相似度不為0的集合對,假設有p個,最壞情況下每一對都有n個整數,則這一部分的時間複雜度為o(pn)。如果要使用這種方法,就要求我們提前能夠用某種資料結構表示出相似的部分,亦即對於乙個給定的整數x,有哪些集合包含x,這也就是倒排索引,整體的時間複雜度為o(sn + pn)

這道題很難和正確結果進行比較,也不知道預期輸出是怎麼個演算法得來的,最好是找個工具排個序最後再文字比較下。

class

solution}}

map,int

> pair2intersize;

void

computeintersectionsize()

}}} vector ans;

void

adjusttosimilarities

(const vectorint>>

&docs)

}public

: vector

computesimilarities

(vectorint>>

& docs)

};

書上還給出了另外一種方法,將所有的元素排序,這樣相同的元素就會聚到一起,之後的處理方法就和上面的相同了,時間複雜度為o(sn * logsn + pn),和上面不用unordered_map的情況一樣,但是執行時間沒多大區別。

class

solution

bool

operator

<

(const element &rhs)};

vector sorted;

void

sortdocs

(const vectorint>>

&docs)

}sort

(sorted.

begin()

, sorted.

end())

;}map

,int

> pair2intersize;

void

computeintersectionsize()

}}vector ans;

void

adjusttosimilarities

(const vectorint>>

&docs)

}public

: vector

computesimilarities

(vectorint>>

& docs)

};

程式設計師面試金典

1.有個小孩正在上樓梯,樓梯有n階台階,小孩一次可以上1階 2階 3階。請實現乙個方法,計算小孩有多少種上樓的方式。為了防止溢位,請將結果mod 1000000007 給定乙個正整數intn,請返回乙個數,代表上樓的方式數。保證n小於等於100000。int countways int n retu...

程式設計師面試金典 2 2

return kth to last 返回單鏈表中倒數第k個元素。下面會分別使用遞迴和非遞迴的方法來解決這道題,一般來說遞迴的方法寫起來更容易,但是效率一般不是最好的,比如這道題遞迴解法的 量大約是非遞迴解法的一半,但是時間複雜度依然是o n 遞迴解法。這種方法的本質是先遍歷到鍊錶尾部,最後再返回的...

程式設計師面試金典 2 4

partition 編寫 將鍊錶中小於x的元素放在鍊錶的前半部分,大於x的元素放在鍊錶的後半部分,沒有順序要求。如果是陣列的話,根據x對陣列進行劃分的方法類似於快排。對於鍊錶會更簡單一些,可以直接將原始鍊錶拆分為兩個鍊錶,乙個中所有元素比x小,乙個中所有元素比x大,最後再進行連線。通過在鍊錶中使用b...