Data Retrieval 資料檢索

2021-09-26 15:00:46 字數 572 閱讀 6752

index 索引

定義		

分類 [1]結構化資料 固定格式、有限長度 應用:資料庫、元資料

[2]非結構化資料 非定格式、非限長度 應用:磁碟檔案

查詢方式

[1]結構化查詢 資料庫搜尋

[2]非結構化查詢 [a]順序掃瞄

[b]全文檢索

定義		根據使用者需求,從資料庫提取資料,生成資料表。[ 資料表:可放回資料庫,也可進一步處理  ]

流程 [1]排序

[2]篩選

檢索方法

[1]順序檢索 逐個比較、判斷相等:關鍵字、資料區的資料 n/2次比較

[2]對分檢索

[3]索引查詢

定義
定義		首先建立索引,然後對其搜尋的過程
定義		

分類 [1]正序索引 根據位置,查詢內容

[2]逆序索引 根據內容,查詢位置

[3]全文索引

資料探勘 資料

對關注的屬性,樣本與原始資料集有相同的性質,則用抽樣計算的結果與全集是一樣。1.1 抽樣的方法 1 簡單隨機抽樣 random sampling 放回 不放回 2 分層抽樣 stratified sampling 如果資料集不同型別的資料數量差異過大,則隨機抽樣會丟失數量少的樣本。可針對不同資料組,...

大資料資料

作業系統 核心 分配和管理硬體 庫 沒有入口的應用軟體 應用軟體 1 設定網絡卡為nat模式 2 確保windows下的服務是否啟動 dhcp,net服務 3 編輯檔案 vi etc sysconfig network scripts ifcfg eth0 4 onboot yes 5 設定ip s...

大資料 資料分析 資料探勘

在大資料領域裡,經常會看到例如資料探勘 olap 資料分析等等的專業詞彙。如果僅僅從字面上,我們很難說清楚每個詞彙的意義和差別。大講台老師通過一些大資料在高校應用的例子,來為大家說明白 資料探勘 大資料 olap 資料統計的區別。一 資料分析 資料分析是乙個大的概念,理論上任何對資料進行計算 處理從...