Oracle問題分析採集資料的方法

2022-05-25 05:45:14 字數 2151 閱讀 6643

1.背景:

運維人員或多或少都會遇到分析問題、分析故障的時候,往往在碰到一些棘手的問題事,我們都會往更深層次的專家進行求助。不管是二線專家還是oracle全球服務工程師(後文稱gcs工程師),往往都會讓你提交這樣那樣的資料。基本每次都會碰到這樣的情況,問一點資料給一點,主要的成本消耗都在提取資料中。

2.獲取什麼資料:

l  osw

l  nmon

l  日誌檔案

l  awr/ash

l  dba_hist_active_sess_history

l  opatch

3.如何獲取資料:

經過多年的運維經驗進行總結,我們建議至少要提供問題發生前1小時的資料,如問題發生在今天10:00,那麼資料由今天9:00開始提供,一直到問題恢復後30分鐘。

l  osw

這個是oracle提供的對系統監控的工具,實質是vmstat等,有時候osw有資料但nmon無資料,有時候則相反,故就算部署了nmon仍然建議部署osw的原因。集資料間隔建議20秒採集一次。

獲取資料指令碼:

touch -t 201705091300 test1   

touch -t 201705091400 test2

find . -type f -newer test1 ! -newer test2|xargs tar cvf oswdata_ggdb2.tar

ps: 201705091300代表2023年5月9日13時

l  nmon

經典的系統監控工具,在aix、linux上都有其版本。建議最多60秒採集一次,目前來看,比較多地方用了nmon採集資料,但是採集間隔為10~20分鐘,導致了採集了跟無採集一樣。

獲取資料只需cat或者ftp相關的工具即可。

l  日誌檔案

tfa是個11.2版本上推出的用來收集grid infrastructure/rac環境下的診斷日誌的工具,它可以用非常簡單的命令協助使用者收集rac裡的日誌,以便進一步進行診斷;tfa是類似diagcollection的乙個oracle 集群日誌收集器,而且tfa比diagcollection集中和自動化的診斷資訊收集能力更強大。tfa有以下幾個特點:

獲取資料的指令碼:

用root或者grid執行

# $tfa_home/bin/tfactl diagcollect -all -from "jan/21/2013 00:00:00" -to "jan/21/2013 13:00:00"

11gr2之前的,可以根據業支團隊採集資料的指令碼執行命令即可。

l  awr/ash

awr和ash是oracle常用的工具,需問題分析時,需要提供正常時間段和問題時間段的awr和ash報告。awr報告每小時生成乙份,ash每15—30分鐘生成乙份。

l  dba_hist_active_sess_history

在很多情況下,當資料庫發生效能問題的時候,我們並沒有機會來收集足夠的診斷資訊,比如system state dump或者hang analyze,甚至問題發生的時候dba根本不在場。這給我們診斷問題帶來很大的困難。那麼在這種情況下,我們是否能在事後收集一些資訊來分析問題的原因呢?在oracle 10g或者更高版本上,答案是肯定的。本文我們將介紹一種通過dba_hist_active_sess_history的資料來分析問題的一種方法。

獲取資料的方式:

在發生問題的資料庫上執行exp提取需要的資料:

sql> conn user/passwd

sql> create table m_ash as select * from dba_hist_active_sess_history where sample_time between to_timestamp ('', 'yyyy-mm-dd hh24:mi:ss') and to_timestamp ('', 'yyyy-mm-dd hh24:mi:ss');

執行匯出:

$ exp user/passwd file=m_ash.dmp tables=(m_ash) log=m_ash.exp.log

l  opatch

$ $oracle_home/opatch/opatch lsinventory

4.小結:

本文提供了問題分析時,一般需要採集的資料,通過既定的標準化進行資料採集,降低人員反覆獲取資料等時間消耗,也同時降低因無第一時間採集資料導致資料丟失無法分析出問題根本原因的風險。

採集資料小總結

採集過程遇到的問題 1.十分鐘內訪問資料頁面,需要輸入驗證碼 2.每天ip限定訪問五十個以內,用完則明天再來 b 剛開始的解決辦法 b 去抓取網上提供的 ip 埠,然後 訪問 問題 ip好多不能用,需要 ip個數較多,然後還要根據採集 的規則設定,比如十分鐘內每個 訪問規則數量 1,之後再次訪問.b...

PV,V,UV的概念,採集資料

guid ip 隨機數 firstvisit.gif 表示新使用者 pagevi 0.gif 超出規定時間的使用者 pagevi 1.gif 1 天以後的時間段 pagevi 2.gif 30 分鐘 1 天時間段 pagevi 3.gif 0 30 分鐘時間 綜合瀏覽量 pv 統計所有的資料 訪問次...

如何更有價值採集資料 高效分析資料

上回說到,使用者行為資料的意義和價值 為什麼要做使用者行為分析?以及網際網路產品使用者模型的構建,這其中就包含了對資料的採集和分析兩大塊兒,本文將從資料採集的三大要點 如何讓分析更有價值更高效 以及資料分析思維三部分展開聊。一 資料採集的三大要點 1 全面性 資料量足夠具有分析價值 資料面足夠支撐分...