python去除拼音聲調字母,替換為字母的方法

2022-09-27 11:33:10 字數 852 閱讀 4443

第一種方法

import sys

import unicodedata

s = "l zhu w"

remap =

# 去除\t, \f, \r

a = s.translate(remap)

'''  通過使用dict.fromkeys() 方法構造乙個字典,每個unicode 和音符作為鍵,對於的值全部為none

然後使用unicodedata.normalize() 將原始輸入標準化為分解形式字元

sys.maxunicode : 給出最大unicode**點的值的整數,即1114111(十六進製制的0x10fff

unicodedata.combining:將分配給字元chr的規範組合類作為整數返回。 如果未定義組合類,則返回0。

'''cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) www.cppcns.com#此部分建議拆分開來理解

b = unicodedata.normalize('nfd', a)

'''   呼叫translate 函式刪除所有重音符

'''print(b.translate(cmb_chrs))

第二種方法 (推薦)

import unicodedata

mystr='l zhu w'

unicodedata.normalize('nfkd', mystr).epslmljgrbuncode('ascipslmljgrbui','ignore')

本文標題: python去除拼音聲調字母,替換為字母的方法

本文位址:

python漢字轉換為拼音

使用pypinyin包 pip install pypinyin from pypinyin import pinyin,normal 將漢字轉換為拼音,pinyin 轉換後是列表,不加style轉換後帶聲調 pos 1 for piny in pinyin self.name,style norm...

python直接把漢字轉換為拼音

萬能pip安裝pinyin庫 2 起鍋燒油開始炒菜 基本呼叫 pinyin.get 天地君親師!3 其他佐料 如果想要兩個拼音之間有分隔符分開,可以使用delimitrer引數。比如可以設定空格 pinyin.get 天地君親師 delimiter 很多時候,這樣的符號並不適合計算機來讀取。form...

python 漢字轉拼音 獲取首字母

方式 一 通過第三方庫 import pinyin print pinyin.get 漢字 獲取首字母,可將中文字串轉為中文列表 然後獲取每乙個漢字的拼音字串取第乙個然後拼接即可 print pinyin.get 漢 0 方式 二 通過編碼對比 def single get first unicod...