unicode轉utf 8一次記錄

2021-10-06 02:21:18 字數 521 閱讀 5385

文字如下:

%u4e2d%u592e%u5e7f%u64ad%u7535%u89c6%u5927%u5b66%uff0c%u4e2d%u56fd%u653f%u6cd5%u5927%u5b66

需要轉成utf-8,嘗試了好多編碼和轉碼一起使用,最後終於解決,直接上**

c=

'%u4e2d%u592e%u5e7f%u64ad%u7535%u89c6%u5927%u5b66%uff0c%u4e2d%u56fd%u653f%u6cd5%u5927%u5b66'

.replace(

"%",

'\\'

)d=c.encode(

'utf-8'

).decode(

"unicode-escape"

)print

(d)##**廣播電視大學,中國政法大學

1. 先將字元中的百分號,換成\

2. 先進行utf-8編碼,再用unicode-escape解碼

轉 Unicode 和 UTF 8 的區別

簡單來說 unicode 是 字符集 utf 8 是 編碼規則 其中 字符集 為每乙個 字元 分配乙個唯一的 id 學名為碼位 碼點 code point 編碼規則 將 碼位 轉換為位元組序列的規則 編碼 解碼 可以理解為 加密 解密 的過程 廣義的 unicode 是乙個標準,定義了乙個字符集以及...

Linux 下實現UTF8轉Unicode

最近用到sim卡發簡訊,需要提取傳送的資料,並將傳送的資料轉為unicode碼,因為利用pdu模式傳送簡訊的時候,需要unicode碼才能傳送。對資料的轉換需要了解,資料在linux下被儲存為什麼型別的碼值,以及目前的碼值轉換為unicode需要怎樣處理。linux下的資料在記憶體裡的儲存是utf8...

泰文utf 8轉unicode編碼實現

前言 最近的有個專案是要讀取泰文然後將泰文疊加到上。查了一周的資料,所有的流程已經走通了。泰文轉成unicode編碼 泰文實際上是utf 8編碼的,這也就是編譯器以utf 8的格式才可以正常顯示泰文的原因。unicode編碼轉成泰文並進行疊加 泰文渲染是採用了freetype第三方庫進行顯示的,fr...