深入詳解SQL中的Null

2021-07-27 02:42:35 字數 3969 閱讀 9767

null 在計算機和程式設計世界中表示的是未知,不確定。雖然中文翻譯為 「空」, 但此空(null)非彼空(empty)。 null表示的是一種未知狀態,未來狀態,比如小明兜裡有多少錢我不清楚,但也不能肯定為0,這時在計算機中就使用null來表示未知和不確定。

雖然熟練掌握sql的人對於null不會有什麼疑問,但總結得很全的文章還是很難找,看到一篇英文版的, 感覺還不錯。

tony hoare 在2023年發明了 null 引用, 並認為這是他犯下的「幾十億美元的錯誤」. 即便是50年後的今天, sql中的 null 值還是導致許多常見錯誤的罪魁禍首.

我們一起來看那些最令人震驚的情況。

null不支援大小/相等判斷

下面的2個查詢,不管表 users 中有多少條記錄,返回的記錄都是0行:

select * from users where deleted_at = null;

– result: 0 rows

select * from users where deleted_at != null;

– result: 0 rows

怎麼會這樣子? 一切只因為 null 是表示一種「未知」的型別。也就是說,用常規的比較操作符(normal conditional operators)來將 null 與其他值比較是沒有意義的。 null 也不等於 null(近似理解: 未知的值不能等於未知的值,兩者間的關係也是未知,否則數學和邏輯上就亂套了)。

– 注意: 下面的sql適合於mysql,如果是oracle,你需要加上 … from dual;

select null > 0;

– result: null

select null < 0;

– result: null

select null = 0;

– result: null

select null = null;

– result: null

select null != null;

– result: null

將某個值與 null 進行比較的正確方法是使用 is 關鍵字, 以及 is not 操作符:

select * from users

where deleted_at is null;

– result: 所有被標記為刪除的 users

select * from users

where deleted_at is not null;

– result: 所有被標記為刪除的 users

如果想要判斷兩列的值是否不相同,則可以使用 is distinct from:

select * from users

where has_address is distinct from has_photo

– result: 位址(address)或**(photo)兩者只有其一的使用者

not in 與 null

子查詢(subselect)是一種很方便的過濾資料的方法。例如,如果想要查詢沒有任何包的使用者,可以編寫下面這樣乙個查詢:

select * from users 

where id not in (select user_id from packages)

但此時假若 packages 表中某一行的 user_id 是 null 的話,問題就來了: 返回結果是空的! 要理解為什麼會發生這種古怪的事情, 我們需要理解sql編譯器究竟幹了些什麼. 下面是乙個更簡單的示例:

select * from users 

where id not in (1, 2, null)

這個sql語句會被轉換為:

select * from users 

where id != 1 and id != 2 and id != null

我們知道,id != null 結果是個未知值, null. 而任意值和 null 進行 and 運算的結果都是 null, 所以相當於沒有其他條件. 那麼出這種結果的原因就是 null 的邏輯值不為 true.

如果條件調換過來, 查詢結果就沒有問題。 現在我們查詢有package的使用者.

select * from users 

where id in (select user_id from packages)

同樣我們可以使用簡單的例子:

select * from users

where id in (1, 2, null)

這條sql被轉換為:

select * from users 

where id = 1 or id = 2 or id = null

因為 where 子句中是一串的 or 條件,所以其中某個的結果為 null 也是無關緊要的。非真(non-true)值並不影響子句中其他部分的計算結果,相當於被忽略了。

null與排序

在排序時, null 值被認為是最大的. 在降序排序時(descending)這會讓你非常頭大,因為 null值排在了最前面。

下面這個查詢是為了根據得分顯示使用者排名, 但它將沒有得分的使用者排到了最前面!

select name, points

from users

order by 2 desc;

– points 為 null 的記錄排在所有記錄之前!

解決這類問題有兩種思路。最簡單的一種是用 coalesce 消除 null的影響:

– 在輸出時將 null 轉換為 0 :

select name, coalesce(points, 0)

from users

order by 2 desc;

– 輸出時保留 null, 但排序時轉換為 0 :

select name, points

from users

order by coalesce(points, 0) desc;

還有一種方式需要資料庫的支援,指定排序時將 null 值放在最前面還是最後面:

select name, coalesce(points, 0)

from users

order by 2 desc nulls last;

當然, null 也可以用來防止錯誤的發生,比如處理除數為0的數**算錯誤。

被 0 除

除數為0是乙個非常 egg-painfull 的錯誤。昨天還執行得好好的sql,突然被0除一下子就出錯了。乙個常用的解決方法是先用 case 語句判斷分母(denominator)是否為0,再進行除法運算。

select case when num_users = 0 then 0 

else total_sales/num_users end;

ase 語句的方式其實很難看,而且分母被重複使用了。如果是簡單的情況還好,如果分母是個很複雜的表示式,那麼悲劇就來了: 很難讀,很難維護和修改,一不小心就是一堆bug.

這時候我們可以看看 null 的好處. 使用 nullif 使得分母為0時變成 null. 這樣就不再報錯, num_users = 0 時返回結果變為 null.

select total_sales/nullif(num_users, 0);

nullif 是將其他值轉為 null, 而oracle的 nvl 是將 null 轉換為其他值

如果不想要 null,而是希望轉換為 0 或者其他數, 則可以在前乙個sql的基礎上使用 coalesce函式:

select coalesce(total_sales/nullif(num_users, 0), 0);

null 再轉換回0

conclusion

tony hoare 也許會後悔自己的錯誤, 但至少 null 存在的問題很容易地就解決了. 那麼快去練練新的大招吧,從此遠離 null 挖出來的無效大坑(nullifying)!

深入詳解SQL中的Null

null 在計算機和程式設計世界中表示的是未知,不確定。雖然中文翻譯為 空 但此空 null 非彼空 empty null表示的是一種未知狀態,未來狀態,比如小明兜裡有多少錢我不清楚,但也不能肯定為0,這時在計算機中就使用null來表示未知和不確定。雖然熟練掌握sql的人對於null不會有什麼疑問,...

sql中null的使用

1.需求 從department表中讀取部署名稱 部門名稱 as 成name 1.1department表中儲存部門 部署 部分 工序 departmentid,arrangeid,partid,processid select departmnet name departid name from ...

Oracle中null的使用詳解

問 什麼是null?答 在我們不知道具體有什麼資料的時候,也即未知,可以用null,我們稱它為空,oracle中,含有空值的表列長度為零。oracle允許任何一種資料型別的字段為空,除了以下兩種情況 1 主鍵字段 primary key 2 定義時已經加了not null限制條件的字段 說明 1 等...