一文看懂kylin

2021-08-28 12:24:49 字數 640 閱讀 5754

kylin到底解決了什麼關鍵問題

要徹底的解決掉資料查詢時間隨著資料量的增長而成線性增長的規律

kylin適合哪類資料的處理

通常查詢資料,一般是統計結果,如果是統計結果,必然會按照維度來進行聚合,kylin的工作原理是多維立方體分析,適合需要從多個維度來觀察資料的查詢。

維度,看資料的角度,比如地區,年,性別

度量,就是查詢的值,比如gmv,日活數

對於n個維度來講,有2的n次方種組合方式,每一種方式為cuboid,所有組合稱為cube

kylin為什麼這麼快

kylin通過預計算,先完成表的關聯,聚合等操作,把資料寫入到hbase,然後查詢的時候再通過預計算的結果來執行查詢。

kylin架構

kylin與其它olap查詢引擎來比較

kylin查詢速度不會受資料量的增長而引響,查詢的時間複雜度穩定在o(1)

一文看懂xml

先簡單介紹下html xml xpath 1.html 超文字語言,用來展示資料。2.xml 可擴充套件標記語言,用來傳輸資料。僅僅是純文字,標籤可自定義。3.xpath 專門在xml中查詢資訊的語言。xml 文件必須包含根元素。該元素是所有其他元素的父元素。xml 文件中的元素形成了一棵文件樹。這...

一文看懂條件編譯

條件編譯概述 就是在滿足一定的條件時才對源 進行編譯。條件編譯一般有3種形式 形式一 a ifdef 識別符號 識別符號定義時,執行程式段1,否則執行程式段2 程式段1 else 程式段2 endif b ifdef 識別符號 程式段1 endif 例如 define k 1 ifdef k pri...

一文看懂邏輯回歸

引數更新 總結多分類問題 現有20個學生投入0 6個小時學習課程的記錄,分析投入時間和是否通過考試的概率的關係。在這個問題中是否通過考試只有兩種結果 通過和不通過。可以用虛擬變數1和0分別表示。我們用y代表已知的考試結果,x為已知的投入時間,發現其中還有乙個隱藏變數 知識掌握程度,可以先設為z,假設...