Hive之引數設定

2021-10-05 17:45:13 字數 945 閱讀 7715

系統內建函式

檢視系統自帶函式

show functions;

顯示自帶函式的用法

desc function upper;

詳細顯示自帶函式的用法

desc function extended upper;

fetch抓取

1.hive.fetch task.conversion設定成more,如下查詢語句不會執行mapreduce

set hive.fetch task.conversion=more;(預設)

select * from emp;

select ename from emp;

select ename from emp limit 3;

2.hive.fetch task.conversion設定成none,如下查詢語句都會執行mapreduce

set hive.fetch task.conversion=none;

select * from emp;

select ename from emp;

select ename from emp limit 3;

本地模式

hive可以通過本地模式在單台機器上處理所有的任務。對於小資料集,執行時間可以明顯被縮短。

set hive.exec.mode.local.auto=true;//開啟本地mr

//設定local mr的最大輸入資料量,當輸入資料量小於這個值時採用local mr的方式,預設為134217728,即128m

set hive.exec.mode.local.auto.inputbytes.max=50000000;

hive 引數設定

本文 開發hive應用時,不可避免地需要設定hive的引數。設定hive的引數可以調優hql 的執行效率,或幫助定位問題。然而實踐 中經常遇到的乙個問題是,為什麼設定的引數沒有起作用?這通常是錯誤的設定方式導致的。對於一般引數,有以下三種設定方式 配置檔案 hive的配置檔案包括 使用者自定義配置會...

Hive引數設定

1.設定執行引擎 set hive.execution.engine mr set hive.execution.engine spark 設定為mr則呼叫hadoop的mr執行 設定執行引擎為spark則呼叫spark執行任務。若有條件設定為spark,因為執行比hadoop的mr快。2.啟動動態...

引數設定 pandas引數設定小技巧

python大資料分析記錄 分享 成長 在日常使用pandas的過程中,由於我們所分析的資料表規模 格式上的差異,使得同樣的函式或方法作用在不同資料上的效果存在差異。而pandas有著自己的一套 引數設定系統 可以幫助我們在遇到不同的資料時靈活調節從而達到最好的效果,本文就將介紹pandas中常用的...