mysql中in與exists效率比較

2021-08-13 17:00:44 字數 3146 閱讀 1196

這條語句適用於a錶比b表大的情況

select * from ecs_goods a where cat_id in(select cat_id from ecs_category);

這條語句適用於b錶比a表大的情況

select * from ecs_goods a where exists(select cat_id from ecs_category b where a.cat_id = b.cat_id);

原因:(**)

select * from a

where id in(select id from b)

以上查詢使用了in語句,in()只執行一次,它查出b表中的所有id欄位並快取起來.之後,檢查a表的id是否與b表中的id相等,如果相等則將a表的記錄加入結果集中,直到遍歷完a表的所有記錄.

它的查詢過程類似於以下過程

list resultset=;

array a=(select * from a);

array b=(select id from b);

for(int i=0;i可以看出,當b表資料較大時不適合使用in(),因為它會b表資料全部遍歷一次.

如:a表有10000條記錄,b表有1000000條記錄,那麼最多有可能遍歷10000*1000000次,效率很差.

再如:a表有10000條記錄,b表有100條記錄,那麼最多有可能遍歷10000*100次,遍歷次數大大減少,效率大大提公升.

結論:in()適合b錶比a表資料小的情況

select a.* from a a 

where exists(select 1 from b b where a.id=b.id)

以上查詢使用了exists語句,exists()會執行a.length次,它並不快取exists()結果集,因為exists()結果集的內容並不重要,重要的是結果集中是否有記錄,如果有則返回true,沒有則返回false.

它的查詢過程類似於以下過程

list resultset=;

array a=(select * from a)

for(int i=0;i當b錶比a表資料大時適合使用exists(),因為它沒有那麼遍歷操作,只需要再執行一次查詢就行.

如:a表有10000條記錄,b表有1000000條記錄,那麼exists()會執行10000次去判斷a表中的id是否與b表中的id相等.

如:a表有10000條記錄,b表有100000000條記錄,那麼exists()還是執行10000次,因為它只執行a.length次,可見b表資料越多,越適合exists()發揮效果.

再如:a表有10000條記錄,b表有100條記錄,那麼exists()還是執行10000次,還不如使用in()遍歷10000*100次,因為in()是在記憶體裡遍歷比較,而exists()需要查詢資料庫,我們都知道查詢資料庫所消耗的效能更高,而記憶體比較很快.

結論:exists()適合b錶比a表資料大的情況

當a表資料與b表資料一樣大時,in與exists效率差不多,可任選乙個使用.

在查詢的兩個表大小相當的情況下,3種查詢方式的執行時間通常是:

exists <= in <= join

not exists <= not in <= left join

只有當表中字段允許null時,not in的方式最慢:

not exists <= left join <= not in

但是如果兩個表中乙個較小,乙個較大,則子查詢表大的用exists,子查詢錶小的用in,因為in 是把外表和內錶作hash 連線,而exists是對外表作loop迴圈,每次loop迴圈再對內表進行查詢。

下面再看not exists 和 not in

1. select * from a where not exists (select * from b where b.id = a.id);

2. select * from a where a.id not in (select id from b);

看查詢1,還是和上面一樣,用了b的索引

而對於查詢2,可以轉化成如下語句

select * from a where a.id != 1 and a.id != 2 and a.id != 3;

可以知道not in是個範圍查詢,這種!=的範圍查詢無法使用任何索引,等於說a表的每條記錄,都要在b表裡遍歷一次,檢視b表裡是否存在這條記錄

故not exists比not in效率高

mysql中的in語句是把外表和內錶作hash 連線,而exists語句是對外表作loop迴圈,每次loop迴圈再對內表進行查詢。一直大家都認為exists比in語句的效率要高,這種說法其實是不準確的。這個是要區分環境的。

如果查詢的兩個表大小相當,那麼用in和exists差別不大。 

如果兩個表中乙個較小,乙個是大表,則子查詢表大的用exists,子查詢錶小的用in: 

例如:表a(小表),表b(大表)

1:select * from a where cc in (select cc from b)

效率低,用到了a表上cc列的索引;

select * from a where exists(select cc from b where cc=a.cc) 

效率高,用到了b表上cc列的索引。 

相反的2:

select * from b where cc in (select cc from a) 

效率高,用到了b表上cc列的索引;

select * from b where exists(select cc from a where cc=b.cc) 

效率低,用到了a表上cc列的索引。

not in 和not exists如果查詢語句使用了not in 那麼內外表都進行全表掃瞄,沒有用到索引;而not extsts 的子查詢依然能用到表上的索引。所以無論那個表大,用not exists都比not in要快。 

in 與 =的區別 

select name from student where name in ('zhang','wang','li','zhao'); 

與 select name from student where name='zhang' or name='li' or name='wang' or name='zhao' 

的結果是相同的。

MySQL中exists與in的使用

exists對外表用loop逐條查詢,每次查詢都會檢視exists的條件語句,當 exists裡的條件語句能夠返回記錄行時 無論記錄行是的多少,只要能返回 條件就為真,返回當前loop到的這條記錄,反之如果exists裡的條 件語句不能返回記錄行,則當前loop到的這條記錄被丟棄,exists的條件...

MySQL中exists與in的使用

總結 當涉及到外表和子查詢時,要考慮到exists和in 的選擇 exists的子句是乙個boolean條件,這個子句當能返回結果集則為true,不能返回結果集則為 false,子句為真所的記錄會被加入結果集,子句為假所的記錄被拋棄結果集為空 in查詢相當於多個or條件的疊加,in查詢就是先將子查詢...

mysql中exists與in的使用

exists對外表用loop逐條查詢,每次查詢都會檢視exists的條件語句,當exists裡的條件語句能夠返回記錄行時 無論記錄行是多少,只要能返回 條件就為真,返回當前loop到的這條記錄,反之如果exists裡的條件語句不能返回記錄行,則當前loop到的這條記錄被丟棄,exists的條件就像乙...