對資料處理的要求
定義:指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合
特點
挑戰
儲存關鍵技術包括:
在可用性、一致性、高併發、高容量等方面達到平衡not only sql database,非關係型、開源**、具有水平擴充套件能力的分布式資料庫
特性
base特性
資料庫一致性最終一致性的形式分類典型資料庫
應用場景
資料模型
優點缺點
鍵值儲存資料庫
redis,voldemort,oracle bdb
主要用於處理大量資料的高效能訪問負載,也用於一些日誌系統等.
key-value鍵值對,通常用雜湊表來實現
查詢速度快
資料無結構化,通常只被當作字串或者二進位制串
列儲存資料庫
hbase,cassandra,rjak
分布式的聯機事務處理系統
以列簇式儲存,將同一列資料存在一起
查詢速度快,可擴充套件性強,容易進行分布式擴充套件
功能相對侷限,不適合隨機的更新
文件儲存資料庫
mongodb,couchdb
web應用
key-value對應的鍵值對,value為版本化文件
資料結構要求不嚴格,表結構可變,不需要預先定義表結構
查詢新能不高,而且缺乏統一的查詢語法
圖儲存資料庫
neo4j,infogrid,infinite graph
社交網路,推薦系統
圖結構利用圖結構相關演算法進行快速查詢
需要對整個圖做計算才能得出需要的資訊,而且這種結構不容易實現分布式的集群方案
(1)具有靈活的體系結構
(2)適應分布式的管理和控制機構
(3)系統的可靠性高、可用性好
(4)區域性應用的響應速度快
(5) 可擴充套件性好,易於整合現有系統
(1)系統通訊開銷大
(2)系統訪問結構複雜
(3)資料安全性和保密性較難處理
1)資料庫結點故障
2)通訊網路出現故障
3)兩階段提交過程**現問題
cap證明:出現故障結點下,三種屬性最多只能滿足兩種
證明:
滿足c,p
滿足a,p
當網路發生故障,伺服器間資料不一致.
有如下兩種解決方案
cap模型方案選擇
與關係型資料庫對比
如果要查詢年齡情況,關係型資料庫需要讀取多個(所有)資料磁碟塊,但是列儲存資料庫只需要讀取某一塊即可,時間短
全稱:hadoop database,構建在hadoop大資料平台上
根據行鍵、列族、列限定符和時間戳來確定乙個單元格
第七章 資料庫設計
資料庫設計概述 資料庫設計是指對於乙個給定的應用環境,構造 設計 優化的資料庫邏輯模式和物理結構,並據此建立資料庫及其應用系統,使之能夠有效地儲存和管理資料,滿足各種使用者的應用需求,包括資訊管理要求和資料操作要求。1 資料庫設計的特點 2 資料庫設計方法 計算機的基礎知識 軟體工程的原理和方法 程...
資料庫第七章答案
1 試述資料庫設計過程。6 定義並解釋概念模型中以下術語 8 某工廠生產若干產品,每種產品由不同的零件組成,有的零件可用在不同的產品上。這些零件由不同的原材料製成,不同零件所用的材料可以相同。這些零件按所屬的不同產品分別放在倉庫中,原材料按照類別放在若干倉庫中。請用 e r 圖畫出此工廠產品 零件 ...
資料庫作業16 第七章 資料庫設計
7 e r圖 10 習題 7 關係模式 系 系號,系名,學校名 班 班號,系號,系名,學生數 學生 學號,姓名,班號,系號 課程 課程號,課程名,課時 選課 學號,課程號,成績 教研室 教研室編號,系號,教研室人數 教授 教師編號,教師姓名,職稱,教研室編號 習題 8 關係模式 倉庫 倉庫編號,儲存...