中文停用詞表 哈工大停用詞表

2021-10-03 22:50:23 字數 3956 閱讀 3801

》),

)÷(1-

」,)、=(:

→℃&*

一一

』. 『

.一./

-- 』=″【

[*]}>

[⑤]]

[①d]

c]ng昉*//

[][②e]

[②g]={}

,也 『

a[①⑥]

[②b]

[①a]

[④a]

[①③]

[③h]

③]1.

-- [②b]

』『 ×××

[①⑧]

0:2

=[[⑤b]

[②c]

[④b]

[②③]

[③a]

[④c]

[①⑤]

[①⑦]

[①g]

∈[ [①⑨]

[①④]

[①c]

[②f]

[②⑧]

[②①]

[①c]

[③c]

[③g]

[②⑤]

[②②]

一.[①h]

.數[]

[①b]

數/[①i]

[③e]

[①①]

[④d]

[④e]

[③b]

[⑤a]

[①a]

[②⑧]

[②⑦]

[①d]

[②j]

〕〔][

://′∈

[②④[⑤e]

12%b]

......................

…………………………………………………③

zxfitl

[③f]

」[①o]

]∧′=[

∪φ∈′|

{-②c

}[③①]

r.l.

[①e]

ψ-[*]-↑.

[②d]

[②[②⑦]

[②②]

[③e]

[①i]

[①b]

[①h]

[①d]

[①g]

[①②]

[②a]

f][⑩]

a][①e]

[②h]

[②⑥]

[③d]

[②⑩]e]〉

】元/噸

[②⑩]

2.3%

5:0

[①]::

[②][③]

[④][⑤]

[⑥][⑦]

[⑧][⑨]

……——?、

。「」《

》!,:

;?.,

.'? ·

———──? —

<

>()

〔〕()-+

~×//

①②③④

⑤⑥⑦⑧

⑨⑩ⅲв

";#@

γμφφ.

× δ■▲

subexp

supsub

lex #%

&'++ξ

++--β<

<±<δ

<λ<φ<<=

==☆=->

>λ_~±~+

[⑤f]

[⑤d]

[②i]

≈ [②g]

[①f]

li㈧

[-......

〉[③⑩]

第二一番

一直乙個

一些許多

種有的是

也就是說

末##末啊阿

哎哎呀哎喲唉

俺俺們按按照

吧吧噠把罷了

被本本著比

比方比如鄙人彼

彼此邊別別的

別說並並且不比

不成不單

不但不獨

不管不光

不過不僅

不拘不論

不怕不然

不如不特

不惟不問不只朝

朝著趁趁著乘

沖除除此之外

除非除了此此間

此外從從而打

待但但是當

當著到得的

的話等等等地

第叮咚對對於

多多少而而況

而且而是

而外而言

而已爾後

反過來反過來說

反之非但

非徒否則嘎嘎登

該趕個各

各個各位

各種各自給根據

跟故故此固然關於管

歸果然果真過

哈哈哈呵和

何何處何況何時嘿哼

哼唷呼哧乎譁

還是還有

換句話說

換言之或

或是或者極了及

及其及至即即便

即或即令

即若即使幾幾時

己既既然既是

繼而加之

假如假若

假使鑑於將較

較之叫接著結果

借緊接著進而盡

儘管經經過就

就是就是說

據具體地說

具體說來

開始開外靠咳

可可見可是可以況且啦

來來著離例如

哩連連同兩者了臨

另另外另一方面論嘛

嗎慢說漫說冒

麼每每當們

莫若某某個某些拿哪

哪邊哪兒

哪個**

哪年哪怕

哪天哪些哪樣那

那邊那兒

那個那會兒

那裡那麼

那麼些那麼樣

那時那些那樣乃

乃至呢能你

你們您寧寧可

寧肯寧願哦嘔

啪達旁人呸憑

憑藉其其次其二

其他其它

其一其餘其中起

起見起見

豈但恰恰相反

前後前者且然而

然後然則讓人家

任任何任憑如

如此如果

如何如其

如若如上所述若若非

若是啥上下尚且

設若設使

甚而甚麼

甚至省得

時候什麼

什麼樣使得是是的

首先誰誰知順

順著似的雖雖然

雖說雖則隨隨著

所所以他他們

他人它它們她

她們倘倘或倘然

倘若倘使騰替

通過同同時哇

萬一往望為

為何為了

為什麼為著喂嗡嗡

我我們嗚嗚呼

烏乎無論

無寧毋寧嘻嚇

相對而言像向

向著噓呀焉

沿沿著要要不

要不然要不是

要麼要是也也罷

也好一一般一旦

一方面一來

一切一樣一則依

依照矣以以便

以及以免

以至以至於

以致抑或因因此

因而因為喲用

由由此可見由於有

有的有關有些又

於於是於是乎與

與此同時

與否與其

越是云云哉再說

再者在在下咱

咱們則怎怎麼

怎麼辦怎麼樣怎樣咋

照照著者這

這邊這兒

這個這會兒

這就是說

這裡這麼

這麼點兒

這麼些這麼樣

這時這些

這樣正如吱之

之類之所以

之一只是

只限只要只有至

至於諸位著著呢

自自從自個兒自各兒

自己自家

自身綜上所述

總的來看

總的來說

總的說來

總而言之總之縱

縱令縱然

縱使遵照作為兮

呃唄咚咦

喏啐喔唷嗬

嗯噯

中文停用詞表

末 末啊阿 哎哎呀哎喲唉 俺俺們按按照 吧吧噠把罷了 被本本著比 比方比如鄙人彼 彼此邊別別的 別說並並且不比 不成不單 不但不獨 不管不光 不過不僅 不拘不論 不怕不然 不如不特 不惟不問不只朝 朝著趁趁著乘 沖除除此之外 除非除了此此間 此外從從而打 待但但是當 當著到得的 的話等等等地 第叮咚...

使用jieba維護自定義詞 停用詞表

對於文字處理來說,好的分詞結果,是一切開始的基礎。下面結合我的使用,簡要說說使用jieba分詞,如何新增 刪除自定義詞,以及使用停用詞表,方便自己以後查閱。import jieba jieba.add word 自定義詞1 jieba.add word 自定義詞2 方法一需要我們手動乙個個新增,當自...

Elasticsearch之停用詞

前提 elasticsearch的停用詞 1 有些詞在文字 現的頻率非常高,但是對文字所攜帶的資訊基本不產生影響。2 英文 a an the of 3 中文 的 了 著 是 標點符號等 4 文字經過分詞之後,停用詞通常被過濾掉,不會被進行索引。5 在檢索的時候,使用者的查詢中如果含有停用詞,檢索系統...