python同義詞替換的實現(jieba分詞)

2022-10-04 15:03:24 字數 1220 閱讀 8551

tihuanwords.txt文件格式

注意:同一行的詞用單個空格隔開,每行第乙個詞為同行詞的替換詞。

年休假 年假 年休

究竟 到底

回家場景 我回來了

**import jieba

def replacesynonymwords(string1):

1讀取同義詞表,並生成乙個字典。程式設計客棧

combine_dict = {}

# synonymwords.txt是同義詞表,每行是一系列同義詞,用空格分割

for line in open("tihuanwords.txt", "r", encoding='utf-8'):

seperate_word = line.strip().split(" ")

num = len(seperate_word)

for i inmxiweg range(1, num):

combine_dict[seperate_word[i]] = seperate_word[0]

print(seperate_word)

print(combine_dict)

# 2提公升某些詞的詞頻,使其能夠被jieba識別出來

jieba.suggest_freq("年休假", tune=true)

# 3將語句切分成單詞

seg_list = jieba.cut(string1, cut_all=false)

f = "/".join(seg_list).encode("utf-8")

f = f.decode("utf-8")

print(f)

# 4返回同義詞替換後的句子

final_sentence = " "

for word in f.splmxiwegit('/'):

if word in combine_dict:

word = combine_dict[word]

final_sentence += word

else:

final_sentence += word

# print final_sentence

return final_sentence

string1 = '年休到底放幾天?'

print(replacesynonymwords(string1))

結果本文標題: python同義詞替換的實現(jieba分詞)

本文位址:

python替換同義詞 jieba替換同義詞

所以我們打算現將使用者的輸入做乙個預處理 將一些同義詞 手動 轉化為 知識圖譜的中標準輸入。構建同義詞檔案tongyici tihuan.txt,每乙個同義詞列為一行,每行第乙個為希望分隔後呈現的詞語,後幾個為第乙個詞的同義詞,用tab鍵分隔,比如 年休假 年假 年休 北京 北平 首都在這個例子裡 ...

Oracle的同義詞

oracle中建立同義詞語句 create synonym table name foruser.table name 其中第乙個user table和第二個user table可以不一樣。此外如果要建立乙個遠端的資料庫上的某張表的同義詞,需要先建立乙個databaselink 資料庫連線 來擴充套...

Oracle的同義詞

oracle的同義詞 oracle的同義詞 synonyms 從字面上理解就是別名的意思,和試圖的功能類似,就是一種對映關係。本文介紹如何建立同義詞語句,刪除同義詞以及檢視同義詞語句。oracle的同義詞總結 從字面上理解就是別名的意思,和試圖的功能類似。就是一種對映關係。1.建立同義詞語句 cre...