原創 從CLOB欄位的XML中提取關係資料研究

2022-07-19 15:51:16 字數 4031 閱讀 4801

從clob欄位的xml中提取關係資料研究

本文中用以下函式:extract、extractvalue、existsnode、xmlsequence、xmltype、xmltable、xmlquery,函式的具體的語法在此不作描述。

在提取資料之前先要把clob資料用xmltype函式據轉換為xml資料。

1.xml中的資料是單錶且只一行資料。

這種情況很簡單且速度很快。示例如下:

select

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/action_code') action_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/route_id') route_id,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/route_actn_code') route_actn_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/deal_org_code') deal_org_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/office_code') office_code  ,

to_date(extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/deal_datetime'),'yyyy-mm-dd hh24:mi:ss') deal_datetime,

to_date(extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/act_datetime'),'yyyy-mm-dd hh24:mi:ss') act_datetime,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/post_way_code') post_way_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/route_kind_code') route_kind_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/bag_count') bag_count,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/bag_weight_sum') bag_weight_sum,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/flight_info') flight_info ,

to_date(extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/create_time'),'yyyy-mm-dd hh24:mi:ss') create_time

from ( select  xmltype(v_msg) v_msg,d_in_time from run$log)

where existsnode(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info') =1;

2.xml中的資料是主從表關係。

這種情況下,在抽取子表時必須用xmlsequence函式轉換為nest table,否則會報ora-22905。另如果從表的資料量達到千數量級時速度很慢。

2.1使用table()函式xmlsequence

示例如下:

select

extractvalue(value(t),'/bag/end_org_code') end_org_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/route_id') route_id,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/route_actn_code') route_actn_code,

extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/deal_org_code') deal_org_code,

to_date(extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/deal_datetime'),'yyyy-mm-dd hh24:mi:ss') deal_datetimed,

to_date(extractvalue(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/act_datetime'),'yyyy-mm-dd hh24:mi:ss') act_datetime,

extractvalue(value(t),'/bag/bag_action') bag_action,

extractvalue(value(t),'/bag/bag_id') bag_id,

extractvalue(value(t),'/bag/label_strip') label_strip,

extractvalue(value(t),'/bag/start_org_code') start_org_code

from ( select  xmltype(v_msg) v_msg,d_in_time from run$log) ,

table(xmlsequence(extract(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/bags/bag'))) t;

2.2使用xmltable()和xmlquery()函式

使用這兩個函式時必須安裝oracle xml db.這種方法比2.1快50%.示例如下:

select extractvalue(v_msg,'/gpdic_xml/bag_detail_infos/bag_detail_info/bag_id') bag_id,

xtab.mail_num ,xtab.mail_action,xtab.mail_remark_code,xtab.mail_other_remark

from run$log_test,

xmltable('for $j in /gpdic_xml/bag_detail_infos/bag_detail_info/mails/mail

return $j'

passing v_msg

columns mail_num varchar2(20) path '/mail/mail_num',

mail_action varchar2(1) path '/mail/mail_action',

mail_remark_code varchar2(20) path '/mail/mail_remark_code',

mail_other_remark varchar2(50) path '/mail/mail_other_remark') xtab

where existsnode(v_msg,'/gpdic_xml/bag_detail_infos/bag_detail_info') >0;

補充一下:

以上sql中的table(xmlsequence(extract(v_msg,'/gpdic_xml/route_detail_infos/route_detail_info/bags/bag'))) t的/gpdic_xml/route_detail_infos/route_detail_info/bags/bag為xml的從表路徑。

Python筆記從html中提取字段

def fun url url total 景區 page size 20 page num 1 ion 白山市 scope 2 output json ak 秘鑰 response requests.get url total url total html response.text print ...

oracle中clob欄位的使用

一 在hibernate.cfg.xml檔案中加乙個property屬性標籤 org.hibernate.dialect.oracle10gdialect oracle.jdbc.driver.oracledriver jdbc oracle thin 17 1 8.1.7 1521 orcl bb...

操作Oracle的clob型別字段

引用 1.插入和更新 插入一條資料,注意clob欄位,需要先插入乙個空的clob型別 empty clob 然後再單獨更新clob欄位 在插入到更新之間一定要將自動提交設為false,否則,再次查詢時就不能正確更新,查詢時一定要用select from table where for update ...