自然語言處理技術及網際網路應用解析(節選)

2021-07-13 15:30:12 字數 1326 閱讀 1191

前網際網路應用中的趨勢:

基於知識網路的全面搜尋需求,其中包括

知識、語義搜尋

(精確的需求理解、直接答案滿足)以及對話式搜尋(智慧型互動)。

主動推薦,不搜即得

精準的個性化服務

面對這樣的搜尋需求時,給nlp帶來了還大的挑戰,主要表現在四個方面:

需求識別,輸入複雜、需求多樣

知識挖掘,**自暗網,資料形式不單一,而且具有各種層次的知識

使用者引導方面,如何建議、擴充套件以及互動

結果組織與展現方面,採用直接答案、聚類或是關係圖都需要考慮  

文字理解包括使用者需求的藍屏以及廣義的理解,

使用者理解就是給使用者建模知道他要做什麼

。基礎的技術角度設計語法分析、句法分析、語義分析、ml模型,在應用中對應了知識圖譜、query分析、智慧型互動等。隨後她從實際的案例來講解這些方面的知識與關聯:

實體挖掘

,例如使用者在搜尋「中國合夥人」時,將會從query log挖掘、url pattern挖掘以及從title中挖掘

ontology建設

,主要是上下位知識挖掘、三元組知識挖掘、相關實體挖掘以及語義標籤挖掘

語義計算

隨後她提到了query理解的內容,query理解的乙個展現就在框計算時理解使用者的意圖給出精確的答案,主要涉及三個方面的內容:

query改寫

意圖歸一

複雜query理解

當使用者輸入有誤時,一般使用機器翻譯模型來進行query改寫;對於乙個query的多種表達方式,使用query pair文字語義匹配計算,目前的準確率是90%,比基線高出絕對值高出10%;針對複雜的query,通過依存分析結果、查詢邏輯表示式以及知識庫推理進行處理。

語用分析使用者智慧型互動部分,吳華博士以語音助手為例進行了例項的分析,

在對話管理中,需要通過置信度、資訊重要性以及歷史資訊來處理來自asr和slu結果的不確定性,然後根據使用者提供的新資訊來確定下一步行為

。在對話管理中主要設計對話控制和對話環境建模兩個模組。對話控制策略是基於框架的控制策略,即框架定義完成指定任務需要的資訊、根據已知的資訊確定之後要問的問題。而更加複雜的對話管理方法是基於ai或者統計學的方法來實現。

為什麼ibm research是許多nlp核心演算法的開創者、microsoft research擁有豪華的nlp科研團隊,反倒是google能第乙個把翻譯做成大規模網際網路產品?李志飛指出:

團隊基因:科學家+工程師

整個谷歌大環境是實用至上

大資料,中英系統用幾千萬對句子

雲架構:gfs、map-reduce、bigtable

由於現成的理論和模型,他認為乙個10個人的開發團隊+16個人的產品團隊完全可以做乙個谷歌翻譯。

網際網路最近技術應用1 網際網路電視

網路電視 ntv,network television 是以寬頻網路為載體,以視音訊多 為形式,以互動個性化為特性,為所有寬頻終端使用者提供全方位有償服務的業務。網路電視是在數位化和網路化背景下產生,是網際網路絡技術與電視技術結合的產物,在整合電視與網路兩大傳播媒介過程中,網路電視既保留了電視形象直...

網際網路及其應用

網際網路以tcp ip進行資料通訊,是建立在一組共同協議之上的網路裝置和線路的物理集合,實現資料交換和資源共享 網際網路網路系統由網路硬體和網路軟體組成。網路硬體包括 伺服器,工作站,網絡卡,通訊介質。網路軟體包括 網路協議和協議軟體 網路通訊軟體和網路作業系統 網際網路的網路體系結構是一種高度結構...

網際網路技術DIY LEARNING A

python基礎語法 資料結構 numpy pandas 展示資料 matplotlib 機器學習方法 tcfs 去中性化?分布式檔案系統 堡壘 大型根節點伺服器?可監控 tensorflow gpu nosql mongdb 主從資料庫多節點備份,壞時自動頂上 臨時master 好時自動恢復 原先...