lua 按utf8編碼拆字串

在做遊戲使用者註冊時使用者名稱要求：只能全是英文本母或者只能是漢字

這個時候出現乙個問題漢字該怎麼檢查呢

local str1 = "發燒發的撒地方"

if str1:match("^[\128-\254]+$") then

print("－－－－－－－－－－－ok2")

else

print("－－－－－－－－－－－－－not ok2")

end從網上找了上述方法你以為它正確嗎？

好吧也正確但是還是會有特殊符號混入進去的比如漢字下的標點符號這些顯然是不可靠的

在乙個lua的qq群問了一下沒人回答（平時挺熱鬧的今天不知道怎麼了看來我人品也有點兒問題呵呵）在quick-x 1 和2 qq群我問了一下

乙個qq名」少年:「的大神說：「你要吧字串拆了按utf8編碼拆了」然後他貼出了一些方法：見下，

function string.utf8find(input,patter)

local len = string.len(input)

local left = len

local arr =

local tb = {}

local tb2 = {}

--拆源

while left ~= 0 do

local tmp = string.byte(input, -left)

local i = #arr

while arr[i] do

if tmp >= arr[i] then

left = left - i

break

endi = i - 1

endif i == 1 then

tb[#tb+1] = string.char(tmp)

else

tb[#tb+1] = string.sub(input,len-left-i +1,len-left)

endend

len = string.len(patter)

left = len

--拆子

while left ~= 0 do

local tmp = string.byte(patter, -left)

local i = #arr

while arr[i] do

if tmp >= arr[i] then

left = left - i

break

endi = i - 1

endif i == 1 then

tb2[#tb2+1] = string.char(tmp)

else

tb2[#tb2+1] = string.sub(patter,len-left-i +1,len-left)

endend

local tlen1 = #tb

local tlen2 = #tb2

local index1 = 1

local index2 = 1

local matchnum = 0

for i = 1, tlen1 do

--源字串的首字元

local c1 = tb[i]

if c1 == tb2[1] then

index1 = i

matchnum = 1

for j = 2,tlen2 do

if tb[index1+j-1] == tb2[j] then

matchnum = matchnum + 1

index1 = index1 + 1

else

break

endend

if matchnum == tlen2 then

return true

endend

endreturn false

end當然還有乙個大神「喵一哈」說：「關鍵是分字，把中文分出來」給了我**：

還有很多大神和同學的幫忙不是重點不寫了在此表示感謝

上面的方法和 **中的方法我還沒有來得及驗證但是光看方法就有很多可取和學習的地方在此記錄下趕快搬磚走起，，，

程式設計中有時候需要用到匹配中文的正則，一般用 [ \u4e00-\u9fa5]+ 即可搞定。不過這正則對一般的火星文鳥語就不太適用了，甚至全形的標點符號都不包含在內。例如遊戲裡面的玩家名，普通青年一般都是漢字，文藝青年會加幾個特殊字元，2b青年火星文鳥語都會用上；這時候你就需要更強大的正則了。其實，遊戲內大部分的玩家名都取自：中日韓統一表意文字（cjk unified ideographs），外加一些特殊的字元；用 [ \u2e80-\ufe4f]+基本都涵蓋了。

lua 按utf8編碼拆字串

字串轉utf8編碼

Lua處理UTF8字串

擷取處理UTF 8編碼字串

lua 按utf8編碼拆字串

字串轉utf8編碼

Lua處理UTF8字串

擷取處理UTF 8編碼字串

相關推薦