閒話Google拼音輸入法及其它(一)

2021-09-21 19:39:54 字數 1832 閱讀 6856

, 暮春三月,草長鶯飛,it業界層出不窮的傳聞八卦也有如雨後春筍此起彼伏地湧入網際網路。這邊廂有所謂人事**,那一處又陡傳高管離職,於是人們奔走相告——灰色唷,黑幕呀,爆料嘍,潛規則啦……

花開數朵,各表一枝,這一回要說的是google拼音輸入法剽竊事件。

這件事其實往簡單裡說也就一句話:google新推出的網際網路輸入法涉嫌剽竊了此前sogou推出的拼音輸入法的詞庫。苦主聲稱在搜狗詞庫建立之初就加入了「詞庫指紋」,現在這些以員工姓名、綽號為印記的「指紋」原封不動地都出現在了google輸入法的詞庫中,甚至一些bug詞語也同樣被轉殖了。

輸入「佟子健」對比:

google輸入法

搜狗輸入法

輸入「趙立洋」對比:

google輸入法

搜狗輸入法

輸入「郭博」對比:

google輸入法

搜狗輸入法

輸入「茹立雲」對比:

google輸入法

起初我想,「詞庫指紋」這個創新的說法當真又形象又精闢,還透著點生物識別的高科技味道,搜狗輸入法小組的工程師們真是太有才了。但是不亦快哉之後啃了乙個雞翅,就憶起其實是有珠玉在前。

話說上個世紀九十年代初,我國漢字字元編碼標準起草人胡萬進先生就曾在「胡」字編碼裡嵌入了聞名遐邇的「胡萬進印」四字,堪稱數字簽名用於智財權保護的啟蒙,只可惜當時沒總結出個「字型檔指紋」的概念包裝。再啃再想,類似詞庫指紋的做法在歷朝歷代流傳的藏頭露尾詩和字謎中也曾有所表現。啃了兩個雞翅就總結出詞庫指紋的創新性有折扣,欣欣然感覺自己也蠻有才的。當然,搜狗採取的版權保護策略能夠師法自然,逾古出新,也算是難能可貴。

新建乙個microsoft office word(2000以上的版本)文件,在其中輸入乙個「胡」字(隸書或者幼園),將字型大小設大(值在100左右或將顯示比例增大為500%),按滑鼠右鍵,在選單中選擇「字型」,將其改為空心字,然後會發現,「胡萬進印」四個字出現在「古」字旁的「十」 字中間

啃到第三個雞翅的時候,看到有pcword也對此事予以長篇報道。但是粗略讀過之後,感覺這樣一件沸沸揚揚的事情翻譯成english不僅起不到樹國人志氣的作用,反而是明珠投暗了。西洋人不僅沒有「字」的概念,而且所有的詞都是由有數的字母組成,要跟他們解釋詞的拼法和詞頻尚有剽竊抄襲一說,豈不是對牛彈琴麼?

看到這裡,大家對google拼音輸入法事件的認識是否又提公升到了乙個新的高度?

有關此事的另外一些觀點,且待明天再與大家分享。

本文**  

拼音輸入法

輸入法輸入漢字的快慢取決於 對漢字編碼的平均長度,也就是 擊鍵次數 乘以 尋找這個鍵所需要的時間。對漢字的編碼分為兩部分 對拼音的編碼和消除歧義性的編碼 最終選擇拼音輸入法,原因有三個優點,可以讓他輸入速度並不慢 1 不需要專門學習 2 輸入自然,不會中斷思維,也就是找每個鍵的時間非常短 3 編碼長...

Google(谷歌)拼音輸入法發布

官方鏈結 官方主頁 根據目前掌握的資料顯示,新的 谷歌拼音 版本號為1.0.15.0,目前具備智慧型組句 流行詞彙 網路同步 一鍵搜尋及英文提示等特色功能。谷歌拼音輸入法除了將集合自身搜尋引擎資源,輸入法能同步搜尋引擎上的熱門詞語和句子外,還將集合微軟拼音和紫光拼音輸入法的優點,解決微軟拼音的長句輸...

Google拼音輸入法的問題

最近一段時間一直在用google拼音,確實很好用,都把微軟拼音給刪了,只留下這乙個輸入法。不過世無完美,google拼音也存在著一些問題,以下是我目前所發現的問題 原文詳見 http baike.baidu.com view 89362.htm 第二個問題是個欠缺 就是沒有音調功能,沒法按音調輸入字...