3種方法輕鬆處理php開發中emoji表情的問題

2021-08-04 17:15:44 字數 1394 閱讀 8031

背景

一般mysql表設計時,都是用utf8字符集的。把帶有emoji的暱稱字段往裡面insert一下就沒了,整個字段變成了空字串。這是怎麼回事呢?

原來是因為mysql的utf8字符集是3位元組的,而emoji是4位元組,這樣整個暱稱就無法儲存了。這要怎麼辦呢?我來介紹幾種方法

解決方案

1、使用utf8mb4字符集

如果你的mysql版本>=5.5.3,你大可直接將utf8直接公升級為utf8mb4字符集

這種4位元組的utf8編碼可完美相容舊的3位元組utf8字符集,並且可以直接儲存emoji表情,是最好的解決方案

至於位元組增大帶來的效能損耗,我看過一些評測,幾乎是可以忽略不計的

2、使用base64編碼

如果你因為某些原因無法使用utf8mb4的話,你還可以使用base64來曲線救國

使用例如base64_encode之類的函式編碼過後的emoji可以直接儲存在utf8位元組集的資料表中,取出時decode一下即可

3、乾掉emoji表情

emoji表情是個麻煩的東西,即使你能儲存,也不一定能完美顯示。在ios以外的平台上,例如pc或者android。如果你需要顯示emoji,就得準備一大堆emoji並使用第三方前端類庫才行。即便如此,還是可能因為emoji不夠全而出現無法顯示的情況在大多數業務場景下,emoji也不是非要不可的。我們可以適當地考慮乾掉它,節約各種成本0

經過一番苦苦的google,終於找到靠譜能用的**:

基本思想就是遍歷字串中的每個字元,如果該字元的長度為4個位元組,就將其刪除:

1

2

3

4

5

6

7

8

9

10

11

12

// 過濾掉emoji表情

functionfilteremoji($str)

,

$str);

return$str;

}

3種方法輕鬆處理php開發中emoji表情的問題

背景 一般mysql表設計時,都是用utf8字符集的。把帶有emoji的暱稱字段往裡面insert一下就沒了,整個字段變成了空字串。這是怎麼回事呢?原來是因為mysql的utf8字符集是3位元組的,而emoji是4位元組,這樣整個暱稱就無法儲存了。這要怎麼辦呢?我來介紹幾種方法 解決方案 1 使用u...

3種方法輕鬆處理php開發中emoji表情的問題

背景 一般mysql表設計時,都是用utf8字符集的。把帶有emoji的暱稱字段往裡面insert一下就沒了,整個字段變成了空字串。這是怎麼回事呢?原來是因為mysql的utf8字符集是3位元組的,而emoji是4位元組,這樣整個暱稱就無法儲存了。這要怎麼辦呢?我來介紹幾種方法 解決方案 1 使用u...

3種方法輕鬆處理php開發中emoji表情的問題

背景 做微信開發的時候就會發現,儲存微信暱稱必不可少。可這萬惡的微信支援emoji表情做暱稱,這就有點蛋疼了 一般mysql表設計時,都是用utf8字符集的。把帶有emoji的暱稱字段往裡面insert一下就沒了,整個字段變成了空字串。這是怎麼回事呢?原來是因為mysql的utf8字符集是3位元組的...