hive正則中3種括號的區別

2021-09-11 03:05:10 字數 840 閱讀 4856

小括號有兩種含義,1是原子組,2是可以將括號內的東西作為值返回

中括號代表字符集。[a-z]代表乙個字母,這個字母在a到z的範圍內。

大括號代表重複數量,[a-z]代表一到二個字母,這兩個字母都在a到z的範圍內

1>. 小括號():匹配小括號內的字串,可以是乙個,也可以是多個,常跟「|」(或)符號搭配使用,是多選結構的

示例1:string name = "way2014";  regex:(way|zgw)  result:結果是可以匹配出way的,因為是多選結構,小括號是匹配字串的

示例2:string text = "123456789";  regex:(0-9) result:結果是什麼都匹配不到的,它只匹配字串"0-9"而不是匹配數字, [0-9]這個字元組才是匹配0-9的數字

2>.中括號:匹配字元組內的字元,比如咱們常用的[0-9a-za-z.*?!]等,在內的字元都是字元,不是元字元,比如「0-9」、「a-z」這中間的「-」就是連線符號,表示範圍的元字元,如果寫成[-!?*(]這樣的話,就是普通字元

示例1: string text = "1234567890";  regex:[0-9]  result:結果是可以匹配出字串text內的任意數字了,像上邊的【或符號「|」在字元組內就是乙個普通字元】

示例2:string text = "a|e|s|v";  regex:[a|e|s]  result:結果就是匹配字元a、e、|三個字元,這個跟(a|e|s)有區別的,區別就是(a|e|s)匹配的是a、e、s三個字元的隨意乙個,三個中的任意乙個,這是的|是元字元

3>.大括號{}:匹配次數,匹配在它之前表示式匹配出來的元素出現的次數,出現n次、匹配最少出現n次、匹配最少出現n次,最多出現m次

正則中圓括號 方括號 大括號 的區別和用法

之前遇到要用正則判斷輸入字串的小需求中遇到了問題,連續的字串不知道怎麼判斷。如郵箱結尾的.com cn net等。於是乎查閱資料 括號 括號是多個匹配,它把括號內的當做一組來處理,限制一些多選的範圍,比如上面的需求只能是com cn net結尾的用括號就是最好的選擇。括號能提取字串,如 com cn...

正則中的小括號 中括號 大括號 分析

乙個示例 var reg d 18 19 20 d 0 1 9 1 012 0 1 9 1 0 9 2 0 9 3 01 d d x x 正規表示式的 有不同的意思。是為了提取匹配的字串。表示式中有幾個 就有幾個相應的匹配字串。s 表示連續的空格 製表符 其他空白。是定義匹配的字元範圍。比如 a z...

hive中四種排序的區別

hive中有四種排序,分別是 order by,sort by,distribute by 重點 cluster by order by 全域性排序,但是只能有乙個reduce來處理,在嚴格模式下必須指定limit,否則會報錯,在資料量很大的時候,處理時間會很長甚至跑不出資料,慎用!sort by ...