基於Hive的日誌資料統計實戰

public boolean next(longwritable key, byteswritable value) throws ioexception

return false ;

}重寫 hiveignorekeytextoutputformat 中 recordwriter 中的 write 方法，示例**如下：

public void write (writable w) throws ioexception

需要注意的是，要使用 udf 功能，除了實現自定義 udf 外，還需要加入包含 udf 的包，示例：

add jar /opt/hadoop/hive-0.5.0-bin/lib/hive_contrib.jar;

然後建立臨時方法，示例：

create temporary function result2csv as 『com.aspire.search.loganalysis.hive. result2csv';

使用完畢還要 drop 方法，示例：

drop temporary function result2csv;

5、輸出 xml 格式的統計結果

前面看到部分日誌統計結果輸出到乙個表中，借助 xmlresultinputformat 和 xmlresultoutputformat 格式化成 xml 檔案，考慮到建立這個表只是為了得到 xml 格式的輸出資料，我們只需實現 xmlresultoutputformat 即可，如果還要支援 select 查詢，則我們還需要實現 xmlresultinputformat ，這裡我們只介紹 xmlresultoutputformat 。

前面介紹過，定製 xmlresultoutputformat 我們只需重寫 write 即可，這個方法將會把 hive 的以』/001』分隔的多字段資料格式化為我們需要的 xml 格式，被簡化的示例**如下：

" );

}text txtxml = new text();

byte strbytes = sbxml.tostring().getbytes( "utf-8" );

txtxml.set(strbytes, 0, strbytes. length );

byte output = txtxml.getbytes();

byteswritable .set(output, 0, output. length );

writer .write( byteswritable );}

基於Hive的日誌資料統計實戰

UV統計海量資料統計的前世今生

常用的資料統計Sql 總結

常用的資料統計Sql 總結

基於Hive的日誌資料統計實戰

UV統計 海量資料統計的前世今生

常用的資料統計Sql 總結

常用的資料統計Sql 總結

相關推薦

UV統計海量資料統計的前世今生