第一章 概述

2021-09-22 18:45:18 字數 2677 閱讀 1052

1.什麼是知識圖譜

知識圖譜是谷歌用來支援語義角度組織網路資料,從而提供智慧型搜尋的知識庫。是通用的語義知識的形式化描述框架,用結點表示語義符號,邊表示符號之間的關係。

用三元組形式描述和儲存知識:如。

知識圖譜表示為 g=,其中e=表示實體集合,r=表示關係集合。s⊆r×e×e

表示三元組的集合。

三元組描述乙個事實,由頭實體,尾實體和描述這兩個實體之間的關係組成。有些關係也稱為屬性,相應地,尾實體稱為屬性值。從圖結構看,實體是知識圖譜的節點,關係是連線兩個節點的有向邊。

2.知識圖譜發展歷程

知識庫在人工智慧和語義網領域的目標可以總結為知識的資料化(讓計算機表示、組織和儲存人類的知識)和資料的知識化(讓資料支援推理、**等智慧型任務)。

3.知識圖譜型別

知識的分類:

(1)根據知識的主客觀性,分為事實性(客觀性)知識和主觀性知識(我認為)

(2)根據知識的變化性質,分為靜態知識(出生日期不變)和動態知識(美國**變)。

(3)領域知識,百科知識,場景知識(訂機票的場景下的資訊),語言知識(**和**是同義詞),常識知識(狗有四條腿)。

知識圖譜分類:

語言知識圖譜:wordnet(由同義詞集和描述同義詞集之間的關係構成),中文知網hownet。

常識知識圖譜:cyc(/ˈsaɪk/實體和關係以及支援推理的常識規則構成),conceptnet(概念以及描述他們之間關係的常識構成)

領域知識圖譜:醫學知識圖譜sider,電影知識圖譜imdb

百科知識圖譜:freebase、dbpedia、yago、wikidata

傳統構建知識圖譜的方法主要基於專家知識(眾包資料),隨著機器學習技術發展,許多知識圖譜使用自動構建知識圖譜的方法,如nell、knowledge vault(google 2023年建立的大規模知識圖譜)

4知識圖譜生命週期

(1)知識體系構建:構建乙個本體描述目標知識。核心即資源描述框架(rdf),rdf包括三個物件型別:資源(resource)、謂語(predicate)及陳述(statements)

資源:能使用rdf表示的物件即資源、如實體、事件和概念。

謂語:描述資源本身特徵和資源之間關係。謂語可定義元資料(謂語頭尾資料型別,與其它謂語關係)

陳述:即rdf三元組《主體(subject),謂語(predicate),賓語(object)>。謂語可以表示主體屬性,也可以表示主體與賓語之間關係,當謂語表示乙個屬性時,賓語就是屬性值,當表示關係時,賓語就是乙個資源。

(2)知識獲取:從文字資料中通過資訊抽取獲取知識,構建三元組。

①結構化資料

優點:置信度高,資料質量可靠;缺點:資料規模小,不容易獲得。

②半結構化資料(具有一定層次和模式,但不能通過固定模板直接獲得結構化資料)

優點:置信度較高,規模比較大;缺點:樣式多變且含有噪音,很難用人工模板抽取。

③非結構化文字資料(自然語言文字資料,如「姚明2023年出生在上海」

從純文字資料中獲取知識稱為文字資訊抽取,包括如下基本任務:實體識別、實體消歧、關係抽取以及事件抽取。

實體識別:從文字中識別實體,確定實體的前後邊界,確定實體的類別。(姚明,人名)

實體消歧:消除指定實體的歧義。(李娜是打網球的李娜,不是跳水的李娜;孫悅是唱歌的孫悅,不是打籃球的孫悅)。實體消歧的任務分為實體鏈結和實體聚類。實體鏈結就是將乙個實體指稱項鍊接到知識圖譜的乙個已有實體上。實體聚類假設知識圖譜中沒有已確定的實體,在給定語料庫的前提下,通過聚類使相同所指的實體指稱項被聚為同一類別。

關係抽取:獲取兩個實體之間的語義關係。語義關係可以是一元關係(實體的型別)、二元關係(實體的屬性)及更高階關係。關係抽取任務有:關係分類(判斷一句話中兩個實體的關係)、屬性抽取(已知乙個實體和關係,判斷另乙個實體) 、關係例項抽取(「姚明」,「上海」判斷關係)      

事件抽取:從描述事件的文字中抽取結構化的事件資訊。

(3)知識融合:將兩個知識圖譜融合。包括知識體系的融合和例項的融合

(4)知識儲存:如何儲存知識圖譜①rdf格式儲存(一行乙個三元組,搜尋效率低)②圖資料庫neo4j   

(5)知識推理: 挖掘兩個實體之間隱含的語義關係,即知識圖譜補全。

自動問答系統          

5 知識圖譜與深度學習

基於深度學習,把處理物件表示為數值(標量、向量、矩陣),通過數值計算完成各種語義計算。

問題:(1)依賴大量標註資料

(2)不可解釋且不可調控

(3)難加入先驗知識

探索1,詞的表示學習:詞表示為分布式向量(上下文相似的詞,語義也相似)。問題:不能區分近義詞還是反義詞

探索2,知識圖譜表示學習:將知識圖譜的實體和關係投影到低維向量空間中,體現實體和關係的語義資訊。問題:隱含表示方式,不易被理解,難以干預推理過程和增加先驗知識。

探索3,神經符號機:神經網路與符號推理相結合的技術。

第一章 概述

1.模擬量輸入,輸出,開關量 閃爍 輸入,輸出及資料通訊 2.模擬量大多為開關量 3.mcu前做為前端採集器,mcu 感測器 4.開發步驟 1 i o分析 2 mcu造型 3 評估系統及相關硬體 4 設計硬體系統 5 硬體系統模組測試 6 軟體系統設計 7 系統測試 8 進一步工作 5.交叉編譯 6...

第一章 概述

modelsim電子系統分析與 于斌,公尺秀傑主編 電子工業出版社 本章內容 1,ic設計流程 2,modelsim的功能和作用 3,modelsim基本流程 1.1ic設計與modelsim ic設計流程包括兩類 正向設計 top down 和反向設計 bottom up 前者指的是從最高層的功能...

第一章 概述

網路協議通常分為不同層次進行開發,tcp ip一般認為有四層,從上到下分別是 應用層 處理應用程式,一般tcp ip提供的通用的應用程式有telnet 遠端登入 ftp 檔案傳輸協議 smtp 簡單郵件傳輸協議 snmp 簡單網路管理協議 運輸層 為兩台主機上的應用程式提供端到端的通訊,在運輸層主要...