階段二 jieba關鍵字提取

2022-01-29 00:40:28 字數 768 閱讀 3549

content = "

該課題針對tdi(甲苯二異氰酸酯)生產廢渣汙染問題,將tdi廢渣進行催化水解生成tda(甲苯二胺)單體,實現了資源再生。創新點如下:1、確定了在溫和反應條件下tda高收率的水解催化劑和相轉移催化劑;2、研發了高粘度、高沸點物料的連續化液固分離技術,實現了萬噸級工業化生產,並形成了工藝技術軟體包;3、開發了催化劑、水的迴圈利用和整合換熱技術,降低了能耗和生產成本。採用該工藝生產的tda,產品檢測合格,滿足tdi生產和其他使用者要求。該技術已獲得中國和美國發明專利(cn 102633651b;us 8,658,828 b2)及實用新型專利(cn 203222567 u),並制定了企業標準(q/cfy01-2014)。該技術實現了tdi生產過程中排放的焦油廢渣的**利用,具有明顯的經濟效益、社會效益和環境效益。

"# 載入停止詞(stop words)文字語料庫

jieba.analyse.set_stop_words(

"stop_words.txt")

# 載入逆向檔案頻率(idf)文字語料庫

jieba.analyse.set_idf_path(

"idf.txt.big");

keywords = jieba.analyse.extract_tags(content, topk=5, withweight=true, allowpos=('

n','v'

,),)

print(keywords)

部分使用的**,網上有相關類似的例子,為資料新增關鍵字,具體資料涉及資料安全,無法截圖上傳。

關鍵字 EXCEL關鍵字提取

如何根據關鍵字列表將單元格中的關鍵字提取出來,本文提供三種方法,看哪一種適合你!開啟excel 表,內容如下 a列為需要提取關鍵字的內容 f列為關鍵字列表 bcd為三種方法演示 方法一 公式 if sumproduct countif a2,f 2 f 13 lookup 0 frequency 0...

python 關鍵字提取

jieba 關鍵字提取 import jieba.analyse tags jieba.analyse.extract tags str,topk 3 str是提取關鍵字的內容,topk是提取關鍵字數 print join tags tf idf關鍵字提取 是用於資訊檢索和文字挖掘的加權技術。是評估...

關鍵字 php提取關鍵字中文分詞

每日17點準時技術乾貨分享 需求 做seo的keywords時,需要從標題或者正文裡提取關鍵字 2.封裝 loaddict pa setsource content pa startanalysis true tags pa getfinallykeywords num 獲取文章中的n個關鍵字 re...