大資料概論期末複習

2021-09-02 15:02:33 字數 1261 閱讀 1911

摩爾定律:

摩爾定律是由英特爾(intel)創始人之一戈登·摩爾(gordon moore)提出來的。其內容為:當**不變時,積體電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,效能也將提公升一倍。換言之,每一美元所能買到的電腦效能,將每隔18-24個月翻一倍以上。這一定律揭示了資訊科技進步的速度。

資料:

資料(data)是事實或觀察的結果,是對客觀事物的邏輯歸納,是用於表示客觀事物的未經加工的的原始素材。

資料可以是連續的值,比如聲音、影象,稱為模擬資料。也可以是離散的,如符號、文字,稱為數字資料。

在計算機系統中,資料以二進位制資訊單元0,1的形式表示。

資料的本質:

資料的本質是生產資料和資產。

資料不再是社會生產的「副產物」,而是可被二次乃至多次加工的原料,從中可以探索更大價值,它變成了生產資料。

大資料是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。大資料就是「未來的新石油」。

雲計算:

雲計算是乙個方便靈活的計算模式,它是按需、可通過網路進行訪問和使用的計算資源的共享池(例如:網路、伺服器、儲存、應用程式服務),它以用最少的管理付出,與服務**商有最少的互動的前提下,可以達到將各種計算資源迅速地配置和推出。

大資料:

大資料(big data)是指無法在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合。從某種程度上說,大資料是資料分析的前沿技術。

5v特徵:

從tb躍公升到pb甚至eb。

海量資料帶來了巨大的商業價值。數 據之間關聯性支援深層的資料探勘。

對資料實時處理有著極高的要求, 通過傳統資料庫查詢方式得到的 「當前結果」很可能已經沒有價值。

課上習題:

大資料時代,使用者產生內容指的是(ugc–user generate content)

(回歸分析)是確定兩種及以上變數間相互依賴的定量關係的一種統計分析方法

百年一見的事比習以為常的事資訊熵大

用資訊增益度來度量熵的(降低)程度

決策樹中每個(葉節點)代表一種可能的分類結果

id3演算法使用(資訊增益度)選擇測試屬性

大資料原理期末複習

1 大資料側重於對海量資料的儲存 分析和處理,從海量資料中發現應用價值,更好地服務社會生活和生產 雲計算實質上旨在整理和優化it資源,並通過網路以服務的方式廉價地提供給使用者,物聯網的發展目標是物物相連,其發展核心是應用創新 2 雲計算 大資料 物聯網三者相輔相成。大資料根值於雲計算,大資料分析的很...

資料庫概論期末複習測試試題

第一章 緒論1.資料庫定義 使用資料庫系統的好處 舉出適合用檔案系統而不是資料庫系統的例子 再舉出適合用資料庫系統的應用例子。資料庫系統的主要特點 dbma的資料控制功能包括 資料模型 是現實世界資料特徵的抽象,是資料庫系統的核心和基礎 資料模型的作用 是資料庫系統的靜態特徵,動態特徵和完整性約束的...

大資料概論

大資料 big data 指無法在一定時間範圍 內用常規軟體工具進行捕捉 管理和處理的資料集合,是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的 海量 高增長率和多樣化的資訊資產。主要解決,海量資料的 儲存和海量資料的 分析計算 問題。按順序給出資料儲存單位 bit byte kb ...