Mynlp中的高效能 自動歧義識別的人名識別演算法

2021-09-27 00:16:19 字數 1016 閱讀 1431

mynlp的人名識別是基於結構化感知機、序列標註模型的實現。獨特之處在於特徵函式和label的設計和其他nlp工具的差別。

該人名識別演算法是基於字元輸入的,也就是說不需要預先分詞,直接從文字中提取人名,

天然具有歧義識別。在pku資料集上,最終f1達94.91,如果剔除古漢語人名的影響,f1可以更高。

呼叫非常簡單

>

>

com.mayabot.mynlpgroupid

>

>

mynlp-segmentartifactid

>

>

3.0.0version

>

dependency

>

perceptronpersonnameservice pps = mynlps.

instanceof

(perceptronpersonnameservice.

class);

list

names = pps.

findname

(" 黃英男 12345328978 湖南婁底雙峰a街道華洪水大廈a座102");

list

names2 = pps.

findname

("小明送給張賀年老師一張賀年卡");

system.out.

println

(names)

; system.out.

println

(names2)

;

輸出:

[personname(name=黃英男, offset=1)]

[personname(name=小明, offset=0), personname(name=張賀年, offset=4)]

注意:在第二句例項中,有兩次出現(張賀年),自動判斷第二個不是人名。

該模型大小為11.5m,記憶體占用45m。

C 中的高效能計時器

原帖及討論 http bbs.bccn.net thread 211272 1 1.html 簡介精確的時間計量方法在某些應用程式中是非常重要的。常用的 windows api 方法 gettickcount 返回系統啟動後經過的毫秒數。另一方面,gettickcount 函式僅有 1ms 的分辨精...

《高效能MySQL》閱讀 MySQL中的事務

20210107 22 00 23 00 承接 高效能mysql 閱讀 mysql架構和歷史 一 一頁書 詩號 世事如棋,乾坤莫測,笑盡英雄啊!9.mysql中的事務 1.mysql中提供了兩種事務型擎innodb和ndbcluster,2.mysql預設是自動提交事務的,就是如果不是顯示的開始乙個...

高效能MySQL中的三星索引

我對此提出了深深的疑問 一星 相關的記錄指的是什麼?相關這個詞很深奧,相關部門 是什麼部門 二星 如果建立了b tree b tree 索引,資料就有序了。三星 索引的列包含了查詢需要所有的列?根本不需要在where查詢條件所有的列上建立索引!我認為一星和二星的rows應該是columns,索引不關...