開源大資料週刊 第90期

2021-08-21 02:58:47 字數 820 閱讀 4168

一年一度的spark summit 2018近日如期在美國舊金山舉行,今年的主題是spark+ai。

elasticsearch 6.3 發布,你們要的sql功能來了

elasticsearch 6.3正式發布,其中帶來了很多新特性,這個版本最大的亮點莫過於內建支援sql模組,本文將簡單介紹如何在elasticsearch中使用 sql。

tableau 收購人工智慧初創公司 empirical systems

如今各雲服務**商開始為客戶提供更多選擇,包括遍布全球各地的主機、更多虛擬化例項配置以及工作負載優化機制,同時亦推出了更多對雲環境內資料進行管理與分析的選項。文章分析了 iaas公有雲市場在2023年又將迎來哪些轉變。

netflix開源新作:大資料發現服務框架metacat

netflix大資料平台的核心架構涉及三項關鍵服務:執行服務(genie)、元資料服務和事件服務。這些想法並非netflix所獨有,在構建乙個能夠滿足現在及未來規模的資料基礎設施時,就需要這樣的架構。其他擁有大量分布式資料集的公司也面臨著類似挑戰。apache atlas、twitter的資料抽象層和linkedin的wherehows(linkedin的資料發現服務)等等,都是為了解決類似問題而構建的,只是他們都有各自的架構選擇。

本文主要介紹餓了麼大資料團隊如何通過對計算引擎入口的統一,降低使用者接入門檻;如何讓使用者自助分析任務異常及失敗原因,以及如何從集群產生的任務資料本身監控集群計算/儲存資源消耗,監控集群狀況,監控異常任務等。

開源大資料週刊 第52期

摘要 利用yarn capacity scheduler在emr集群上實現大集群的多租戶的集群資源隔離和quota限制 本文結合emr集群,講述了如何利用yarn capacity scheduler在emr集群上實現大集群的多租戶的集群資源quota限制與管控。本文根據姜偉華博士在數果智慧型新產品...

開源大資料週刊 第29期

摘要 阿里雲e mapreduce動態 e mapreduce產品即將發布的版本資訊如下 1.5.2版本 增加預定制配置,如試用型 入門型 計算型 記憶體型等 增加包年包月自動續費功能 1.6.0版本 互動式查詢 支援hive spark 資訊 cio時代學院院長姚樂 大資料的行業應用策略 關於大資...

開源大資料週刊 第18期

摘要 本週關注 hadoop集群的規劃 大資料的 位置資料 電商hadoop實戰 alluxio及hadoop spark hive之間的關係。e mapreduce團隊 1.4.1版本 已經發布 1.5.0版本 正在研發 1.6.0版本 e mapreduce hadoop 10大類問題之集群規劃...