百度百科 文字資料探勘

2021-07-30 08:54:00 字數 708 閱讀 4296

文字資料探勘(text mining)是指從文字資料中抽取有價值的資訊和知識的計算機處理技術。

中文名

文字資料探勘

外文名text mining

種    類

基於單文件的資料探勘等

方    法

文字分類,

文字聚類等

概念顧名思義,文字資料探勘是從文字中進行資料探勘(data mining)。從這個意義上講,文字資料探勘是資料探勘的乙個分支。

文字挖掘種類

1.基於單文件的資料探勘

2.基於文件集的資料探勘

文字挖掘方法

1.文字分類

文字分類是一種典型的機器學習方法,一般分為訓練和分類兩個階段。

2. 文字聚類

文字聚類是一種典型的無監督式機器學習方法,聚類方法的選擇取決於資料型別。

3. 資訊抽取

4.摘要

5.壓縮

其中,文字分類和聚類是兩種最重要最基本的挖掘功能。

挖掘工具

1.ibm db2 intelligent miner

2.sas text miner

3.spss text mining

4.dmc textfilter(純文字抽出通用程式庫)應用

文字挖掘傳統商業方面的應用主要有,企業競爭情報、crm、電子商務**、搜尋引擎,現在已擴充套件到醫療、保險和諮詢行業。

AnimateWindow 百度百科

animatewindow 開放分類 程式設計 計算機 api 函式功能 該函式能在顯示與隱藏視窗時能產生特殊的效果。有兩種型別的動畫效果 滾動動畫和滑動動畫。函式原型 bool animatewindow hwnd hwnd,dword dwtime,dword dwflags 引數 hwnd 指...

WCF百度百科

根據微軟官方的解釋,wcf 之前的版本名為 indigo 是使用託管 建立和執行面向服務 service oriented 應用程式的統一框架。它使得開發者能夠建立乙個跨平台的安全 可信賴 事務性的解決方案,且能與已有系統相容協作。wcf是微軟分布式應用程式開發的集大成者,它整合了.net平台下所有...

Mashup 百度百科

mashup是糅合,是當今網路上新出現的一種網路現象,將兩種以上使用公共或者私有資料庫的web應用,加在一起,形成乙個整合應用。一般使用源應用的api介面,或者是一些rss輸出 含atom 作為內容源,合併的web應用用什麼技術,則沒有什麼限制。mashup在geek群體和網際網路玩家之中獲得了極大...