Oracle CLOB處理 文字查詢對比

2021-10-23 19:26:00 字數 860 閱讀 3474

clob裡儲存的文字格式是

[name

李大哥age

20…]

或者[暫無登記]

業務要求:要查詢出來clob的內容,並且找到裡面有個文字是 '暫無登記』的資料。

涉及到的操作:

去除換行:select replace(欄位名,chr(10),』』) from dual;

去除回車:select replace(欄位名,chr(13),』』) from dual;

去掉左右空格:select trim(欄位名) from dual;

判斷colb的長度:select dbms_lob.getlength(欄位名) from 表名;

轉換colb為字元:select dbms_lob.substr(欄位名,4000) from 表名;

期間可能報錯:

60502:緩衝區太小,我的解決辦法是把查詢的from後面的表的資料縮減,先把一些限制條件加入子表,(因為基表很大,但是業務資料只有幾百條,用幾個條件先篩選一部分資料)解決了這個問題。

64203:clob中格式符號太多,需要只摘取文字,就可以解決這個問題。

最後將以上提到的都組合在一起就是

select trim(replace(replace(t1.欄位名,chr(10),』』),chr(13),』』))

from (select 欄位名 from table t where t.id = ? and dbms_lob.getlength(t.欄位名) <6 and ) t1

where dbms_lob.substr(t1.欄位名,4000) = 『暫無登記』;

(這裡其實可以不用子查詢也是可以的)

shuf處理文字

在cu上面看到了乙個帖子,帖子的內容即要求是 請教一下,我需要頻繁不斷地聯接9臺伺服器執行某個相同的服務。但我有特殊的要求 1。每次都按不同的順序來訪問這9臺伺服器。例如 135987642,下次又是亂序依次訪問。2。希望這9臺伺服器的主機名通過乙個shell 指令碼整合不需要另外起乙個txt文件來...

文字預處理

常見預處理步驟,預處理通常包括四個步驟 讀入文字 分詞建立字典,將每個詞對映到乙個唯一的索引 index 將文字從詞的序列轉換為索引的序列,方便輸入模型 現有的工具可以很好地進行分詞,我們在這裡簡單介紹其中的兩個 spacy和nltk。text mr.chen doesn t agree with ...

文字預處理

本文章內容主要學習文字預處理的基本步驟及實現。1 讀入文字 2 分詞 3 建立詞典,將每乙個詞對映到乙個唯一的索引 4 將文字從詞的序列轉換為索引的序列,方便輸入模型 此處用一部英文 即h.g.well的time machine,作為示例,展示文字預處理的具體過程。def read time mac...