關於在大量資料n個中取前k個資料的一點記錄

2021-09-11 18:05:59 字數 415 閱讀 9503

之前面試的時候硬是想不起來，面試官提醒之後才想起來自己也接觸到過這樣的題目。

一般都是用的堆排序，建立大小為k的大頂堆，使用前k個數直接建堆，則對頂是最大數，再使用第k+i(i=1,2,3...)個數去和堆頂做比較，小於則替換堆頂，再進行沉降，大於則跳過。這樣就可以始終保持此k大小的堆為前k個數。

複雜度應該是nlogk。

今天看到演算法筆記中提到使用快排也可以。

思想是選中合適基準將資料分為兩段，兩段大小分別為x，y，x>k時，直接拋棄第二段，否則再將第二段y大小的資料選基準分割，分割分別為y1，y2，再將y1和k-x進行比較，y1>k-x時拋棄後半段，否則在進行上面的操作...

遞迴的思想不斷分割出k大小的資料段（累計為k），平均複雜度應該也是nlogk。取決於隨機選中的基準大小了...

只是一點思想，想起來了便寫下來。

如何從前N個資料中找到前K個大小的資料並列印？

要解決這個問題，那麼我們可以從前十個資料入手，先拿到前十個資料，接下來我們以求前2000個資料中前十個小的資料為例取出前十個資料，我們把它放入小跟堆裡從十乙個資料vec i 開始，我們與第一小minheap.top 資料作比較。如果vec i minheap.top 則將vec i 的值賦給mi...

在海量資料中找到最大的前K個數（top K問題）

問題分析資料是海量的，可能達到10億或者100億以上，只需要找最大的前100個數。所以將資料一次性排序然後取前100個是不太可取的操作。做了很多無用功，並且記憶體一次性也載入不了海量資料。解決方案方案一堆。一般說在很多資料中取前多少個資料，我們都會想到堆，這裡我們使用堆來解決問題。首先取k個數...

取一表前N條記錄，各個資料庫的SQL寫法

取一表前n條記錄，各個資料庫的sql寫法花了點時間整理了一下取一表前n條記錄，各個資料庫的sql寫法 1.oracle select from table1 where rownum n 2.informix select first n from table1 3.db2 select row...