Python中文編碼格式轉換 usc2轉ansi

# @version：python2.7

# usc2轉ansi

乙個帶有中文字串s，json.loads (s)之後

對其進行列印，中文被轉換成了形如\u5e73\u5b9a的形式。

使用編碼工具中的編碼助手對其進行解碼得知，從\u5e73\u5b9a到中文'平定'的轉換為usc2轉ansi。

既然知道了兩種字元的編碼格式，剩下的就只剩如何解決了。

這兒有乙個類似的問題，

有乙個字串， usc2內容是：

%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d…

對應的ansi的內容是：在應答之前傳送訊息成功，請等待答覆…

在python2如何進行互相轉換？

一樓v2ex@cute給出的答案是：

s = '%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d'
print s.replace('%u','\\u').decode('raw_unicode_escape').encode('gbk')

我測試了一下結果輸出是亂碼，於是對以上的解決方法進行了修改。

s.replace('%u','\\u').decode('raw_unicode_escape').encode('utf-8')

即可正常輸出中文：

在應答之前傳送訊息成功，請等待答覆

實際上我的需求跟上面的例子正好相反，我需要將中文轉換成為形如\u5e73\u5b9a的格式。

在以上的解決方案中逆向走就ok了，比如：

print
'平定'.decode('utf-8').encode('raw_unicode_escape')
# 輸出為：\u5e73\u5b9a
print
'北京'.decode('utf-8').encode('raw_unicode_escape')
# 輸出為：\u5317\u4eac

v2ex-python2　如何將usc2與ansi互相進行編碼轉換？

精易論壇-\u5927 這種是啥編碼誒,怎麼轉成漢字

Python輸出 u編碼將其轉換成中文

整個 demo coding utf 8 小豬短租爬取 import requests from bs4 import beautifulsoup import json defget xinxi i url i html requests.get url soup beautifulsoup ht...

Python輸出 u編碼將其轉換成中文的例項

了下。python2.7在window上的編碼確實是個坑解決如下如果是個字典的話要先將其轉成字串匯入json庫然後這麼輸出 json.dumps data decode unicode escape 整個 demo coding utf 8 小豬短租爬取 import requests f...

常見編碼格式（中文編碼）

中文編碼主要有以下四種 gb2312簡體中文編碼，乙個漢字占用2個位元組，在大陸是主要的編碼方式。當文章網頁中包含正體中文日文韓文等時，這些內容可能無法被正確編碼。big5正體中文編碼，主要在台灣地區使用。gbk支援簡體及正體中文，但對他國非拉丁字母語言還是有問題。utf 8 unicode編...

Python中文編碼格式轉換 usc2轉ansi

Python輸出 u編碼將其轉換成中文

Python輸出 u編碼將其轉換成中文的例項

常見編碼格式（中文編碼）

相關推薦