Python中文編碼格式轉換 usc2轉ansi

2021-08-15 04:28:01 字數 1358 閱讀 3465

# @version:python2.7

# usc2轉ansi

乙個帶有中文字串s,json.loads (s)之後

對其進行列印,中文被轉換成了形如\u5e73\u5b9a的形式。

使用編碼工具中的編碼助手對其進行解碼得知,從\u5e73\u5b9a到中文'平定'的轉換為usc2轉ansi

既然知道了兩種字元的編碼格式,剩下的就只剩如何解決了。

這兒有乙個類似的問題,

有乙個字串, usc2內容是:

%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d…

對應的ansi的內容是: 在應答之前傳送訊息成功,請等待答覆…

在python2如何進行互相轉換?

一樓v2ex@cute給出的答案是:

s = '%u5728%u5e94%u7b54%u4e4b%u524d%u53d1%u9001%u8baf%u606f%u6210%u529f%uff0c%u8bf7%u7b49%u5f85%u7b54%u590d'

print s.replace('%u','\\u').decode('raw_unicode_escape').encode('gbk')

我測試了一下結果輸出是亂碼,於是對以上的解決方法進行了修改。

s.replace('%u','\\u').decode('raw_unicode_escape').encode('utf-8')
即可正常輸出中文:

在應答之前傳送訊息成功,請等待答覆

實際上我的需求跟上面的例子正好相反,我需要將中文轉換成為形如\u5e73\u5b9a的格式。

在以上的解決方案中逆向走就ok了,比如:

print

'平定'.decode('utf-8').encode('raw_unicode_escape')

# 輸出為:\u5e73\u5b9a

print

'北京'.decode('utf-8').encode('raw_unicode_escape')

# 輸出為:\u5317\u4eac

v2ex-python2 如何將usc2與ansi互相進行編碼轉換?

精易論壇-\u5927 這種是啥編碼誒,怎麼轉成漢字

Python輸出 u編碼將其轉換成中文

整個 demo coding utf 8 小豬短租爬取 import requests from bs4 import beautifulsoup import json defget xinxi i url i html requests.get url soup beautifulsoup ht...

Python輸出 u編碼將其轉換成中文的例項

了下。python2.7在window上的編碼確實是個坑 解決如下 如果是個字典的話要先將其轉成字串 匯入json庫 然後 這麼輸出 json.dumps data decode unicode escape 整個 demo coding utf 8 小豬短租爬取 import requests f...

常見編碼格式(中文編碼)

中文編碼主要有以下四種 gb2312簡體中文編碼,乙個漢字占用2個位元組,在大陸是主要的編碼方式。當文章 網頁中包含正體中文 日文 韓文等時,這些內容可能無法被正確編碼。big5正體中文編碼,主要在台灣地區使用。gbk支援簡體及正體中文,但對他國非拉丁字母語言還是有問題。utf 8 unicode編...