hue介紹系列02 李孟 新浪部落格

2021-10-10 12:08:25 字數 1000 閱讀 7498

配置cd /etc/hue/conf

vi hue.ini 

desktop default_hdfs_superuser hadoop hdfs管理使用者

desktop http_host 10.10.41.123 hue web server所在主機/ip

desktop http_port 8000 hue web server服務埠

desktop server_user hadoop 執行hue web server的程序使用者

desktop server_group hadoop 執行hue web server的程序使用者組

desktop default_user yanjun hue管理員

hadoop/hdfs_clusters fs_defaultfs hdfs://hadoop6:8020 對應core-site.xml配置項fs.defaultfs

hadoop/hdfs_clusters hadoop_conf_dir /usr/local/hadoop/etc/hadoop hadoop配置檔案目錄

hadoop/yarn_clusters resourcemanager_host hadoop6 對應yarn-site.xml配置項yarn.resourcemanager.hostname

hadoop/yarn_clusters resourcemanager_port 8032 resourcemanager服務埠號

hadoop/yarn_clusters proxy_api_url http://hadoop6:8888 對應yarn-site.xml配置項yarn.web-proxy.address

beeswax hive_server_host 10.10.41.123 hive所在節點主機名/ip

beeswax hive_server_port 10000 hiveserver2服務埠號

beeswax hive_conf_dir /usr/local/hive/conf hive配置檔案目錄

資料倉儲系列 簡介 李孟 新浪部落格

打算做資料倉儲系列,可能會時間上跨度很大,畢竟現在專案比較繁忙。一.資料倉儲定義 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它出於分析性報告和決策支援目的而建立。為需要業務智慧型的企業,提供指導業...

資料倉儲系列 建模 李孟 新浪部落格

一.資料倉儲的資料模型 1.系統記錄域 system of record 這部分是主要的資料倉儲業務資料儲存區,資料模型在這裡保證了資料的一致性。2.內部管理域 housekeeping 這部分主要儲存資料倉儲用於內部管理的元資料,資料模型在這裡能夠幫助進行統一的元資料的管理。3.彙總域 summa...

Hbase原理系列 成員 李孟 新浪部落格

安裝url hbase集群部署 一.簡介 hbase是乙個高可靠性 高效能 面向列 可伸縮 稀疏的分布式儲存系統,利用hbase技術可在廉價pc server上搭建起大規模結構化儲存集群。hbase的目標是儲存並處理大型的資料,更具體來說是僅需使用普通的硬體配置,就能夠處理由成千上萬的行和列所組成的...