[Lua]文字列および文字列の一致
17949 ワード
--luaの文字列インデックスは、前から1,2,...,後ろから-1,-2,....
--stringライブラリ内のすべてのfunctionは文字列を直接操作せず、結果を1つだけ返します.
きほんかんすう
関数#カンスウ#
説明
例
結果
len
文字列の長さの計算
string.len("abcd")
4
rep
文字列sを返すn個のコピー(repeat繰返し)
string.rep("abcd",2)
abcdabcd
lower
文字列のすべての大文字を返します
string.lower("AbcD")
abcd
upper
文字列のすべての小文字を返します
string.upper("AbcD")
ABCD
format
printfのようなフォーマット文字列を返します
string.format("the value is:%d",4)
the value is:4
sub
サブ文字列substring from index i to j of sを返します
string.sub("abcd",2)
bcd
string.sub("abcd",-2)
cd
string.sub("abcd",2,-2)
bc
string.sub("abcd",2,3)
bc
find
文字列で検索すると、一致する列の開始インデックスと終了インデックスが返されます.そうしないとnilが返されます.3番目のパラメータはオプションです.ターゲット列の検索の開始位置を示します.
string.find("cdcdcdcd","ab")
nil
string.find("cdcdcdcd","cd")
1 2
string.find("cdcdcdcd","cd",7)
7 8
gsub
グローバル文字列置換文字列内置換(substitution置換)には、ターゲット列、モード列、置換列の3つのパラメータがあります.4番目のパラメータはオプションで、置換の範囲を制限します.
string.gsub("abcdabcd","a","z");
zbcdzbcd 2
string.gsub("aaaa","a","z",3);
zzza 3
byte
文字の整数形式を返します.文字->数値
string.byte("ABCD",4)
68
char
整数値を文字に変換して接続し、数値->文字
string.char(97,98,99,100)
abcd
きほんモードれつ
正規表現
文字クラス
説明
例
結果
.
任意の文字
string.find("",".")
nil
%s
空白文字(space)
string.find("ab cd","%s%s")
3 4
%S
空白以外の文字
string.find("ab cd","%S%S")
1 2
%p
句読点文字(punctuation)
string.find("ab,.cd","%p%p")
3 4
%P
非句読点文字
string.find("ab,.cd","%P%P")
1 2
%c
コントロール文字
string.find("abcd\t","%c%c")
5 6
%C
非制御文字
string.find("\tabcd","%C%C")
3 4
%d
数値(digit)
string.find("abcd12","%d%d")
5 6
%D
非数値
string.find("12abcd","%D%D")
3 4
%x
16進数(hexadecimal)
string.find("efgh","%x%x")
1 2
%X
16進数以外
string.find("efgh","%X%X")
3 4
%a
アルファベット(alpha)
string.find("AB12","%a%a")
1 2
%A
アルファベット以外
string.find("AB12","%A%A")
3 4
%l
小文字(lowercase)
string.find("ABab","%l%l")
3 4
%L
大文字
string.find("ABab","%L%L")
1 2
%u
大文字(uppercase)
string.find("ABab","%u%u")
1 2
%U
大文字以外
string.find("ABab","%U%U")
3 4
%w
文字と数字
string.find("a1()","%w%w")
1 2
%W
非アルファベット非数値
string.find("a1()","%W%W")
3 4
エスケープ文字%
文字クラス
説明
例
結果
%
エスケープ文字
string.find("abc%..","%%")
4 4
string.find("abc..d","%.%.")
4 5
[]で文字セットを作成し、「-」をハイフネーション、「^」を文字セットの補完を表します.
文字クラス
説明
例
結果
[01]
マッチングバイナリ
string.find("32123","[01]")
3 3
[AB][CD]
AC、AD、BC、BDのマッチング
string.find("ABCDEF","[AB][CD]")
2 3
[[]]
相手カッコ[]を一致させる
string.find("ABC[]D","[[]]")
4 5
[1-3]
一致数1~3
string.find("312","[1-3][1-3][1-3]")
1 3
[b-d]
マッチングアルファベットb-d
string.find("dbc","[b-d][b-d][b-d]")
1 3
[^%s]
空白以外の文字の一致
string.find(" a ","[^%s]")
3 3
[^%d]
任意の数値以外の文字に一致
string.find("123a","[^%d]")
4 4
[^%a]
任意のアルファベット以外の文字を一致させる
string.find("abc1","[^%a]")
4 4
()でキャプチャ
文字クラス
説明
例
結果
()
取得文字列
string.find("12ab","(%a%a)")
3 4 ab
string.find("ab12","(%d%d)")
3 4 12
キャプチャは、モード列の一部を使用してターゲット列の一部に一致させるメカニズムです.キャプチャしたいモードをカッコで囲み、キャプチャを指定します.print(string.find("name=Anna",((%a+)%s*=%s*(%a+)))))))))--1 11 name Anna,マッチングおよびキャプチャ結果print(string.find("name=Anna","%a+%s*=%s*%a+")))--1 11,キャプチャ結果'%a+'のみがフィリピン空のアルファベットシーケンスを表す;'%s*'は0個以上の空白を表す.
上記の例では、モード全体は、1つのアルファベットシーケンス、後に任意の複数の空白、次いで'='であり、後に任意の複数の空白、次いで1つのアルファベットシーケンスを表す.2つのアルファベットシーケンスは、カッコで囲まれたサブモードであり、一致するとキャプチャされます.マッチングが発生すると、find関数は常にマッチング列のインデックスの下付きを返し、サブモードマッチングのキャプチャ部分を返します.
モード修飾子
モード修飾子は、常に修飾された後に置かなければなりません.1つ以上の数字---print(string.find("[17/1/2015],"%d+")))--2 3
修飾子
説明
例
結果
+
1つ以上を表し、最大1つに一致します.
string.find("aaabbb","(a+b)")
1 4 aaab
string.find("cccbbb","(a+b)")
nil
-
0個以上を表し、最低個を一致させる
string.find("zzxyyy","(xy-)")
3 3 x
string.find("zzzyyy","(x-y)")
4 4 y
*
0個以上を表し、最大数に一致します.
string.find("mmmnnn","(m*n)")
1 4 mmmb
string.find("lllnnn","(m*n)")
4 4 n
?
0個または1個を表す
string.find("aaabbb","(a?b)")
3 4 ab
string.find("cccbbb","(a?b)")
4 4 b
インスタンスの適用
Stringライブラリ拡張
--stringライブラリ内のすべてのfunctionは文字列を直接操作せず、結果を1つだけ返します.
きほんかんすう
関数#カンスウ#
説明
例
結果
len
文字列の長さの計算
string.len("abcd")
4
rep
文字列sを返すn個のコピー(repeat繰返し)
string.rep("abcd",2)
abcdabcd
lower
文字列のすべての大文字を返します
string.lower("AbcD")
abcd
upper
文字列のすべての小文字を返します
string.upper("AbcD")
ABCD
format
printfのようなフォーマット文字列を返します
string.format("the value is:%d",4)
the value is:4
sub
サブ文字列substring from index i to j of sを返します
string.sub("abcd",2)
bcd
string.sub("abcd",-2)
cd
string.sub("abcd",2,-2)
bc
string.sub("abcd",2,3)
bc
find
文字列で検索すると、一致する列の開始インデックスと終了インデックスが返されます.そうしないとnilが返されます.3番目のパラメータはオプションです.ターゲット列の検索の開始位置を示します.
string.find("cdcdcdcd","ab")
nil
string.find("cdcdcdcd","cd")
1 2
string.find("cdcdcdcd","cd",7)
7 8
gsub
グローバル文字列置換文字列内置換(substitution置換)には、ターゲット列、モード列、置換列の3つのパラメータがあります.4番目のパラメータはオプションで、置換の範囲を制限します.
string.gsub("abcdabcd","a","z");
zbcdzbcd 2
string.gsub("aaaa","a","z",3);
zzza 3
byte
文字の整数形式を返します.文字->数値
string.byte("ABCD",4)
68
char
整数値を文字に変換して接続し、数値->文字
string.char(97,98,99,100)
abcd
きほんモードれつ
正規表現
文字クラス
説明
例
結果
.
任意の文字
string.find("",".")
nil
%s
空白文字(space)
string.find("ab cd","%s%s")
3 4
%S
空白以外の文字
string.find("ab cd","%S%S")
1 2
%p
句読点文字(punctuation)
string.find("ab,.cd","%p%p")
3 4
%P
非句読点文字
string.find("ab,.cd","%P%P")
1 2
%c
コントロール文字
string.find("abcd\t","%c%c")
5 6
%C
非制御文字
string.find("\tabcd","%C%C")
3 4
%d
数値(digit)
string.find("abcd12","%d%d")
5 6
%D
非数値
string.find("12abcd","%D%D")
3 4
%x
16進数(hexadecimal)
string.find("efgh","%x%x")
1 2
%X
16進数以外
string.find("efgh","%X%X")
3 4
%a
アルファベット(alpha)
string.find("AB12","%a%a")
1 2
%A
アルファベット以外
string.find("AB12","%A%A")
3 4
%l
小文字(lowercase)
string.find("ABab","%l%l")
3 4
%L
大文字
string.find("ABab","%L%L")
1 2
%u
大文字(uppercase)
string.find("ABab","%u%u")
1 2
%U
大文字以外
string.find("ABab","%U%U")
3 4
%w
文字と数字
string.find("a1()","%w%w")
1 2
%W
非アルファベット非数値
string.find("a1()","%W%W")
3 4
エスケープ文字%
文字クラス
説明
例
結果
%
エスケープ文字
string.find("abc%..","%%")
4 4
string.find("abc..d","%.%.")
4 5
[]で文字セットを作成し、「-」をハイフネーション、「^」を文字セットの補完を表します.
文字クラス
説明
例
結果
[01]
マッチングバイナリ
string.find("32123","[01]")
3 3
[AB][CD]
AC、AD、BC、BDのマッチング
string.find("ABCDEF","[AB][CD]")
2 3
[[]]
相手カッコ[]を一致させる
string.find("ABC[]D","[[]]")
4 5
[1-3]
一致数1~3
string.find("312","[1-3][1-3][1-3]")
1 3
[b-d]
マッチングアルファベットb-d
string.find("dbc","[b-d][b-d][b-d]")
1 3
[^%s]
空白以外の文字の一致
string.find(" a ","[^%s]")
3 3
[^%d]
任意の数値以外の文字に一致
string.find("123a","[^%d]")
4 4
[^%a]
任意のアルファベット以外の文字を一致させる
string.find("abc1","[^%a]")
4 4
()でキャプチャ
文字クラス
説明
例
結果
()
取得文字列
string.find("12ab","(%a%a)")
3 4 ab
string.find("ab12","(%d%d)")
3 4 12
キャプチャは、モード列の一部を使用してターゲット列の一部に一致させるメカニズムです.キャプチャしたいモードをカッコで囲み、キャプチャを指定します.print(string.find("name=Anna",((%a+)%s*=%s*(%a+)))))))))--1 11 name Anna,マッチングおよびキャプチャ結果print(string.find("name=Anna","%a+%s*=%s*%a+")))--1 11,キャプチャ結果'%a+'のみがフィリピン空のアルファベットシーケンスを表す;'%s*'は0個以上の空白を表す.
上記の例では、モード全体は、1つのアルファベットシーケンス、後に任意の複数の空白、次いで'='であり、後に任意の複数の空白、次いで1つのアルファベットシーケンスを表す.2つのアルファベットシーケンスは、カッコで囲まれたサブモードであり、一致するとキャプチャされます.マッチングが発生すると、find関数は常にマッチング列のインデックスの下付きを返し、サブモードマッチングのキャプチャ部分を返します.
モード修飾子
モード修飾子は、常に修飾された後に置かなければなりません.1つ以上の数字---print(string.find("[17/1/2015],"%d+")))--2 3
修飾子
説明
例
結果
+
1つ以上を表し、最大1つに一致します.
string.find("aaabbb","(a+b)")
1 4 aaab
string.find("cccbbb","(a+b)")
nil
-
0個以上を表し、最低個を一致させる
string.find("zzxyyy","(xy-)")
3 3 x
string.find("zzzyyy","(x-y)")
4 4 y
*
0個以上を表し、最大数に一致します.
string.find("mmmnnn","(m*n)")
1 4 mmmb
string.find("lllnnn","(m*n)")
4 4 n
?
0個または1個を表す
string.find("aaabbb","(a?b)")
3 4 ab
string.find("cccbbb","(a?b)")
4 4 b
インスタンスの適用
local number = {}
--
function number.commaSeperate(num)
local formatted,k = tostring(tonumber(num)),0
while true do
-- [0,1] ,[1,n] , 3 , 1 2
formatted, k = string.gsub(formatted,"^(-?%d+)(%d%d%d)",'%1,%2')
if k == 0 then break end
end
return formatted
end
local str = number.commaSeperate("-456852963")
print(str)---456,852,963
function string.ltrim(str)
return string.gsub(str, "^[ \t
\r]+", "")
end
function string.rtrim(str)
return string.gsub(str, "[ \t
\r]+$", "")
end
function string.trim(str)
str = string.gsub(str, "^[ \t
\r]+", "")
return string.gsub(str, "[ \t
\r]+$", "")
end
Stringライブラリ拡張
--------------------------------
-- @module string
string._htmlspecialchars_set = {}
string._htmlspecialchars_set["&"] = "&"
string._htmlspecialchars_set["\""] = """
string._htmlspecialchars_set["'"] = "'"
string._htmlspecialchars_set[""] = ">"
-- start --
--------------------------------
-- HTML
-- @function [parent=#string] htmlspecialchars
-- @param string input
-- @return string#string
--[[--
HTML
~~~ lua
print(string.htmlspecialchars(""))
--
~~~
]]
-- end --
function string.htmlspecialchars(input)
for k, v in pairs(string._htmlspecialchars_set) do
input = string.gsub(input, k, v)
end
return input
end
-- start --
--------------------------------
-- HTML , string.htmlspecialchars()
-- @function [parent=#string] restorehtmlspecialchars
-- @param string input
-- @return string#string
--[[--
HTML , string.htmlspecialchars()
~~~ lua
print(string.restorehtmlspecialchars(""))
--
~~~
]]
-- end --
function string.restorehtmlspecialchars(input)
for k, v in pairs(string._htmlspecialchars_set) do
input = string.gsub(input, v, k)
end
return input
end
-- start --
--------------------------------
--
HTML
-- @function [parent=#string] nl2br
-- @param string input
-- @return string#string
--[[--
HTML
~~~ lua
print(string.nl2br("Hello
World"))
--
-- Hello
World
~~~
]]
-- end --
function string.nl2br(input)
return string.gsub(input, "
", "
")
end
-- start --
--------------------------------
--
HTML
-- @function [parent=#string] text2html
-- @param string input
-- @return string#string
--[[--
HTML
~~~ lua
print(string.text2html("
World"))
--
--
World
~~~
]]
-- end --
function string.text2html(input)
input = string.gsub(input, "\t", " ")
input = string.htmlspecialchars(input)
input = string.gsub(input, " ", " ")
input = string.nl2br(input)
return input
end
-- start --
--------------------------------
-- ,
-- @function [parent=#string] split
-- @param string input
-- @param string delimiter
-- @return array#array
--[[--
,
~~~ lua
local input = "Hello,World"
local res = string.split(input, ",")
-- res = {"Hello", "World"}
local input = "Hello-+-World-+-Quick"
local res = string.split(input, "-+-")
-- res = {"Hello", "World", "Quick"}
~~~
]]
-- end --
function string.split(input, delimiter)
input = tostring(input)
delimiter = tostring(delimiter)
if (delimiter=='') then return false end
local pos,arr = 0, {}
-- for each divider found
for st,sp in function() return string.find(input, delimiter, pos, true) end do
table.insert(arr, string.sub(input, pos, st - 1))
pos = sp + 1
end
table.insert(arr, string.sub(input, pos))
return arr
end
function string.split2(s, sep)
local t = {}
for o in string.gmatch(s, "([^" .. (sep or " ") .. "]+)") do
table.insert(t, o)
end
return t
end
-- start --
--------------------------------
-- ,
-- @function [parent=#string] ltrim
-- @param string input
-- @return string#string
-- @see string.rtrim, string.trim
--[[--
,
~~~ lua
local input = " ABC"
print(string.ltrim(input))
-- ABC,
~~~
:
-
- \t
-
- \r
]]
-- end --
function string.ltrim(input)
return string.gsub(input, "^[ \t
\r]+", "")
end
-- start --
--------------------------------
-- ,
-- @function [parent=#string] rtrim
-- @param string input
-- @return string#string
-- @see string.ltrim, string.trim
--[[--
,
~~~ lua
local input = "ABC "
print(string.rtrim(input))
-- ABC,
~~~
]]
-- end --
function string.rtrim(input)
return string.gsub(input, "[ \t
\r]+$", "")
end
-- start --
--------------------------------
-- ,
-- @function [parent=#string] trim
-- @param string input
-- @return string#string
-- @see string.ltrim, string.rtrim
--[[--
,
]]
-- end --
function string.trim(input)
input = string.gsub(input, "^[ \t
\r]+", "")
return string.gsub(input, "[ \t
\r]+$", "")
end
-- start --
--------------------------------
-- ,
-- @function [parent=#string] ucfirst
-- @param string input
-- @return string#string
--[[--
,
~~~ lua
local input = "hello"
print(string.ucfirst(input))
-- Hello
~~~
]]
-- end --
function string.ucfirst(input)
return string.upper(string.sub(input, 1, 1)) .. string.sub(input, 2)
end
local function urlencodechar(char)
return "%" .. string.format("%02X", string.byte(char))
end
-- start --
--------------------------------
-- URL ,
-- @function [parent=#string] urlencode
-- @param string input
-- @return string#string
-- @see string.urldecode
--[[--
URL ,
~~~ lua
local input = "hello world"
print(string.urlencode(input))
--
-- hello%20world
~~~
]]
-- end --
function string.urlencode(input)
-- convert line endings
input = string.gsub(tostring(input), "
", "\r
")
-- escape all characters but alphanumeric, '.' and '-'
input = string.gsub(input, "([^%w%.%- ])", urlencodechar)
-- convert spaces to "+" symbols
return string.gsub(input, " ", "+")
end
-- start --
--------------------------------
-- URL ,
-- @function [parent=#string] urldecode
-- @param string input
-- @return string#string
-- @see string.urlencode
--[[--
URL ,
~~~ lua
local input = "hello%20world"
print(string.urldecode(input))
--
-- hello world
~~~
]]
-- end --
function string.urldecode(input)
input = string.gsub (input, "+", " ")
input = string.gsub (input, "%%(%x%x)", function(h) return string.char(checknumber(h,16)) end)
input = string.gsub (input, "\r
", "
")
return input
end
-- start --
--------------------------------
-- UTF8 ,
-- @function [parent=#string] utf8len
-- @param string input
-- @return integer#integer
--[[--
UTF8 ,
~~~ lua
local input = " World"
print(string.utf8len(input))
-- 7
~~~
]]
-- end --
function string.utf8len(input)
local len = string.len(input)
local left = len
local cnt = 0
local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
while left ~= 0 do
local tmp = string.byte(input, -left)
local i = #arr
while arr[i] do
if tmp >= arr[i] then
left = left - i
break
end
i = i - 1
end
cnt = cnt + 1
end
return cnt
end
-- start --
--------------------------------
--
-- @function [parent=#string] formatnumberthousands
-- @param number num
-- @return string#string
--[[--
~~~ lua
print(string.formatnumberthousands(1924235))
-- 1,924,235
~~~
]]
-- end --
function string.formatnumberthousands(num)
local formatted = tostring(checknumber(num))
local k
while true do
formatted, k = string.gsub(formatted, "^(-?%d+)(%d%d%d)", '%1,%2')
if k == 0 then break end
end
return formatted
end
-- start --
--------------------------------
-- a b
-- @function [parent=#string] hasPrefix
-- @param string s
-- @param string prefix
-- @return string#boolean
--[[--
~~~ lua
print(string.hasPrefix("btn_return","btn_"))
-- true
~~~
]]
-- end --
function string.hasPrefix(s, prefix)
if(s == nil or prefix == nil) then return false end
local index = string.find(s, prefix)
if(index == 1) then return true end
return false
end
-- start --
--------------------------------
-- a b
-- @function [parent=#string] hasSuffix
-- @param string s
-- @param string suffix
-- @return string#boolean
--[[--
~~~ lua
print(string.hasSuffix(“bj.png”,".png"))
-- true
~~~
]]
-- end --
function string.GetShortName(str,maxLen)
-- print(str,"===GetShortNameGetShortName===")
maxLen = maxLen or 4
local charNum = sting.getStringCharCount(str)
if charNum > maxLen then
local byteSize = 0
local index = 1
for i = 1 , maxLen do
local byteCount = 0
local curByte = string.byte(str, index)
--print(curByte,"===curBytecurBytecurBytecurByte===" .. maxLen .. " " ..charNum)
if curByte > 0 and curByte < 128 then
byteCount = 1 --1
elseif curByte >= 192 and curByte < 224 then
byteCount = 2 --
elseif curByte >= 224 and curByte < 240 then
byteCount = 3 --
elseif curByte >= 240 and curByte < 248 then
byteCount = 4 --4
end
byteSize = byteSize + byteCount
index = index + byteCount --
end
return string.sub(str,1,byteSize)..'..'
else
return str
end
end
--
function string.getStringCharCount(str)
local lenInByte = #str
-- print("--getStringCharCount--",lenInByte)
local charCount = 0
local i = 1
while (i <= lenInByte)
do
local curByte = string.byte(str, i)
-- print("curBytecurByte==",curByte)
local byteCount = 1
if curByte > 0 and curByte < 128 then
byteCount = 1 --1
elseif curByte >= 192 and curByte < 224 then
byteCount = 2 --
elseif curByte >= 224 and curByte < 240 then
byteCount = 3 --
elseif curByte >= 240 and curByte < 248 then
byteCount = 4 --4
end
local char = string.sub(str, i, i + byteCount - 1)
i = i + byteCount --
charCount = charCount + 1 -- ( )
end
return charCount
end
function string.hasSuffix(s, suffix)
if(s == nil or suffix == nil) then return false end
local pos = string.len(s) - string.len(suffix)
return string.sub(s,pos + 1) == suffix
end