網上資訊抽取技術縱覽

2021-06-22 12:31:17 字數 780 閱讀 2458

網上資訊抽取技術縱覽 (information extraction from world wide web-a survey)

line eikvil 原著 (1999.7) 陳鴻標 譯 (2003.3)

表 4. 1. 七個系統的功能特徵比較

系統            結構化    半結構化    自由式    多槽    缺失資訊    次序變化

shopbot        x                              

wien             x                                     x            

softmealy      x           x                                     x             x*

stalker        x           x                        *           x             x 

rapier          x           x                                     x             x

srv               x           x                                     x             x

whisk          x           x             x         x           x             x*

資訊抽取之街道抽取

從給定的語料中抽取出相應的道路資訊。資料向塘北大道西50公尺 天龍路與龍華路交叉口北50公尺 觀瀾大道490號附近 成都市錦江區海椒市街13號附7號 玉蘭西路 團結北路23號 湖塘鎮火炬北路12號 昆明市晉寧區莊蹺西路28 金水路合作路28 1號 長公大道浙江顯家門業閬中總 旁 安陽街道嶺下東路4號...

Web資訊抽取技術研究的發展歷程

web資訊抽取 web information extraction wie 的前身是文字理解,最早開始於 20世紀60年代中期,主要是從自然語言文字中獲取結構化資訊的研究,這被看作是資訊抽取技術的初始研究。目前,除了強烈的應用需求外,正在推動資訊抽取研究進一步發展的動力主要來自美國國家標準技術研究...

Java抽取網頁資訊

使用正規表示式及字串操作,抽取網頁資訊 去script public static string trimscript string content return result 去除注釋 public static string trimcomment string content return r...