2017 11 14 中文命名實踐的阻力和應對

2021-09-19 20:24:01 字數 992 閱讀 4092

中文命名在商業專案中至今沒有大規模應用. 此文試圖對它的原因做些粗淺**.

討論組中的帖子所有開發者母語都是中文時, 為什麼大多數專案仍然選擇英文命名? · issue #18 · program-in-chinese/overview裡初步歸結出幾個問題:

第一條實際上是惡性迴圈的後果(只有英文命名的**->沒有中文命名的風格->難以開展中文命名實踐->更總結不出風格). 第二條也類似, 但相信也有迫於壓力不願分享中文命名的**的因素. 而後兩條是比較"硬"的技術原因. 第三條其實是技術上比較容易解決的, 只要把原始碼檔案都統一編碼並成為乙個團隊內部的共識即可, 即便如此也足夠讓很多團隊望而卻步了. 第四條是真正的直接影響在**中使用中文的決定性因素. 一旦專案選擇的框架有此類問題, 那麼即使這個框架是開源的, 也幾乎不大可能花時間去為了使用中文命名而改進框架. 而這個問題也間接是由中文命名的實踐少而導致的. 如果自己(母語是中文的開發者)都不在這些開源框架的社群中發聲的話, 國外開發者更不可能為這個需求(在框架中使用中文命名)花費額外的精力.

個人感覺, 實踐中文程式設計(即使只是用中文命名而已)在實用專案裡的阻力, 不外乎一條 -避險. 而這是非常非常合理的. 如果沒有先前的親身經驗積累(確認所有外部依賴的框架/庫中全面支援中文命名), 相信不會有乙個產品負責人會在內外壓力下決定吃螃蟹採用中文命名. 而在幾乎所有公開分享的原始碼都是英文命名的情況下, 僅靠自己來積累這個經驗教訓是幾乎不可能完成的任務, 即使有公司總結出了一套適合自己團隊的中文命名方式, 也很可能是只適用於他們專案使用的框架/環境. 而願意公開分享這些經驗教訓的畢竟是少數(也許也是中文程式設計的實戰專案有哪些?沒有回應的原因之一?). 這樣又反過來使得這類實踐更難以推廣.

中文程式設計專欄的一部分關注就是在現有的語言/框架/工具集中使用中文命名. 希望通過一些深淺不一的嘗試, 逐漸**出一些可行的對中文命名足夠友好的開發套路, 也為有志於此類實踐的同好提供乙個交流分享中文**的場所. 在此過程中, 逐漸積累中文**的數量, 並對中文**風格進行**總結. 希望能為逐步解決上面的死迴圈出一點力.

命名實體識別 命名實體識別競賽中的經驗過擬合

實體競賽最重要的是分數,而分數則對應著資料打標者當時對資料進行標註的心態。所以,有時候資料預處理的方法並不是理論上完美,實際就無敵的。因為打標者的心態不可知。對於過長的文字,打標者的心態很可能是厭惡,那麼在進行實體識別這種繁瑣的人工標註過程中,他們可能只會看前半部分,把一些標籤撈出來,而當前這條資料...

配置中文 一 中文環境的配置

在latex中使用中文需要滿足以下三項條件 1 tex原始檔用utf 8編碼儲存 2 匯入合適的包並正確配置 3 使用xelatex編譯 此處1,3不言自明。關於第2點,一般選擇匯入ctex包或xecjk包,經研究,ctex似是xecjk的高階封裝,此外我也從未使用過ctex,因此以下僅以xecjk...

Centos5 8 中文漢化的方法

按照下面的方法成功使centos支援中文 1.首先系統需要安裝兩個中文支援包 fonts chinese 3.02 12.el5.noarch.rpm fonts iso8859 2 75dpi 1.0 17.1.noarch.rpm 一般第乙個包安裝好了的,可以用rpm qa grep fonts...