top k 問題的幾種解決方法

top k問題是指給定一組數量為n的數，從中找出前k大的數或第k大的數(k <= n)。由於只要能找出前k大的數，即可以得到第k大的數。所以下面先介紹解決前k大數問題的幾種思路：

由於我們只需要找到陣列nums的前k大的數，所以不需要對整個資料進行排序，只需要保持前k大的數有序即可。所以我們可以維護乙個大小為k的陣列tk：

複雜度：對tk排序的複雜度為o(k*logk)，向tk插入資料的複雜度為o(k), 所以遍歷陣列nums並向tk插入資料的複雜度為o(n*k)，總的複雜度為o(k*logk + n*k) 近似為 o(k*n)

如果k的值過大，演算法的複雜度會相應增大

vector
solve1(vector
&nums, int k)
tk[j] = tk[j-1];
j--;
}if(j == 0)
tk[j] = t;}}
return tk;
}

我們可以將待找陣列nums建立為乙個大根堆，然後從建好的堆中一次找出最大的k個數即可。

複雜度：使用篩選法建堆的複雜度為o(n), 然後從大根堆中找出前k大數的複雜度為o(k*logn),所以總的複雜度為：o(n + k*logn)

顯然這個演算法的複雜度要低於部分排序。

vector
solve2(vector
&nums, int k)
return result;
}void adjust(vector
&nums, int i, int n)
nums[parent] = t;
}

分析前面的部分排序演算法，我們可以發現有太多的時間浪費在了對陣列tk的插入操作中，為了提高插入的效率，我們可以將陣列tk組織為乙個小根堆，對於小根堆的插入操作複雜度為o(logk)，這顯然要優於直接插入的複雜度o(k)。

複雜度：總的複雜度為 o(n*logk)

vector
solve3(vector
&nums, int k)
//對tk排序
for(int i = k-1; i >= 0; i--)
return tk;
}void adjust(vector
&nums, int i, int n)
nums[parent] = t;
}

還有一種演算法是基於快速排序的，我們知道每趟快排都會選定乙個基準值，一趟快排後，基準值右邊的所有數都大於這個基準值，所以我們可以通過選取合適的部分遞迴地對這些部分進行一趟快排，直到基準值右邊的數為k個，那麼我們就得到了陣列的前k大的數:

1. 首先對陣列nums進行一趟快排

2. 然後根據關鍵值key的位置進行判斷

3. 如果key的下標 i < n-k : 對i右邊的部分進行一趟快排，然後重複步驟2

4. 如果key的下標 i > n-k : 對i左邊的部分進行一趟快排，然後重複步驟2

5. 如果key的下標 i == n-k ,那麼就返回key(或 i )

上述算中，如果返回key就是陣列中第k大的數，如果返回i就是前k大數的位置，下面的演算法給出的是乙個尋找第k大數的演算法，稍作修改就可以得到前k大的數。

複雜度：o(n)

int qselect(vector
&nums, int left, int right, int k)
nums[low] = key;
if(low == nums.size()-k)
return key;
else
if(low < nums.size()-k)
return qselect(nums, low+1, right, k);
else
return qselect(nums, left, low-1, k);
}}

top k 問題的幾種解決方法

repo init失敗的幾種解決方法

Hash衝突的幾種解決方法

java解決topk問題

top k 問題的幾種解決方法

repo init失敗的幾種解決方法

Hash衝突的幾種解決方法

java解決topk問題

相關推薦