哈爾濱工業大學軟體工程研究室的主要研究方向

2021-08-31 02:17:09 字數 901 閱讀 5907

一、網路資訊檢索:

1、文字檢索:研究linux環境下的大規模文字索引和檢索技術。包括實時索引、索引合併、索引更新、檢索模型、排序演算法、反饋學習。

2、網頁搜尋:研究linux機群環境下的海量網頁的爬行、儲存、分析、索引、檢索技術。包括:面向主題的網頁爬行器、分布式網頁爬行器、分布式檔案系統、分布式資訊檢索、垂直搜尋。

3、企業級搜尋:在windows環境下,針對企業內網分布著大量的結構複雜、異類格式的資料資源,研究其一體化檢索技術。包括:企業資料資源的自動採集、資訊整合、內容索引、內容檢索技術。

4、垂直搜尋:研究特定領域的資訊抽取、資訊檢索技術。應用研究側重於郵件資訊檢索、軍事網頁檢索、數字圖書館。

5、問答系統:研究社會化問答系統,包括:問句分析、問句索引、問句匹配技術。應用研究側重於網際網路社群的問答系統、企業客戶服務的問答系統。

二、網路資訊挖掘:

1、資料庫轉換器:研究異構資料庫(oracle、sybase、sql server等)結構化資料轉換成xml文字的技術,以便後續為之全文索引和檢索機制。

2、文件過濾器:研究將異類格式的辦公文件(office文件、email、pdf、html網頁等)格式文件轉換成文字格式的技術,以便後續為之全文索引和檢索機制。

3、資訊抽取:研究從無(半)結構化的文字中抽取結構化資料的技術。

4、文字挖掘:研究自然語言文字的分析工具(詞法分析、語言模型、句子結構分析等)。

三、網路資訊保安

理論上對匿名通訊原理,匿名通訊工具機制及相關協議研究,系統實踐上結合流量

分析其特徵的方法,剖析開源匿名通訊工具的原始碼,通過與清華大學合作交流開發,已完成系統節點收集與有效性驗證工作,並已有實際系統上線執行。

四、軟體工程:

研究基於流**的遠端教育軟體,基於內容分析的分布式智慧型考試系統。

Hoj 哈爾濱工業大學 1867 經理的煩惱

樹狀陣列入門,對這種被動接受的東西,總是不習慣 code include include include include include include include include include include include include include include include i...

2023年哈爾濱工業大學計算機研究生機試真題

題目描述 給定a和n,計算a aa aaa a.a n個a 的和。輸入 測試資料有多組,輸入a,n 1 a 9,1 n 100 輸出 對於每組輸入,請輸出結果。樣例輸入 1 10 樣例輸出 1234567900 include includeusing namespace std int resul...

哈爾濱工業大學2023年複試上機題 解題報告

九度oj題目1045 百雞問題 時間限制 1 秒 記憶體限制 32 兆 特殊判題 否 提交 1865 解決 685 題目描述 用小於等於n元去買100隻雞,大雞5元 只,小雞3元 只,還有1 3元每只的一種小雞,分別記為x只,y只,z只。程式設計求解x,y,z所有可能解。輸入 測試資料有多組,輸入n...