在ASP中用“正則表達(dá)式對(duì)象”來(lái)校驗(yàn)數(shù)據(jù)的合法性
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
我們?cè)谥谱骶W(wǎng)站的時(shí)候,尤其是各種電子商務(wù)網(wǎng)站,首先都會(huì)讓用戶填寫一些表格來(lái)獲取注冊(cè)用戶的各種信息,因?yàn)橛脩粲锌赡茌斎敫魇礁鳂拥男畔?而有些不符合要求的數(shù)據(jù)會(huì)給我們的后端asp處理程序帶來(lái)不必要的麻煩,甚至導(dǎo)致網(wǎng)站出現(xiàn)一些安全問(wèn)題。因此我們?cè)趯⑦@些信息保存到網(wǎng)站的數(shù)據(jù)庫(kù)之前,要對(duì)這些用戶所輸入的信息進(jìn)行數(shù)據(jù)的合法性校驗(yàn),以便后面的程序可以安全順利的執(zhí)行。所以我們一般會(huì)在后端編寫一個(gè)asp的校驗(yàn)程序來(lái)分析用戶輸入的數(shù)據(jù)是否是合法的。
[p][/p] [p]或許有人會(huì)問(wèn)了,使用運(yùn)行在客戶端的javascript不是可以更好更快的來(lái)校驗(yàn)用戶的數(shù)據(jù)嗎?的確,這樣在大多的情況下是可以的,為什么是大多情況下呢?因?yàn)槟憔帉懙膉avascript不一定可以完全正常的同時(shí)運(yùn)行在ie以及netscape上面,因?yàn)槲④浀膉script并不全和javascript相同,再加上還有一些瀏覽器不一定和微軟以及netscape兼容的很好,所以很有可能在客戶端的javascript不會(huì)精確的校驗(yàn)用戶輸入的各種數(shù)據(jù),而asp程序是運(yùn)行在服務(wù)器端的,只是和你的服務(wù)器的環(huán)境有關(guān),無(wú)論客戶端是什么瀏覽器,對(duì)于你的asp程序來(lái)說(shuō)都是沒(méi)有分別的,所以選擇使用后端的asp程序來(lái)進(jìn)行數(shù)據(jù)合法性的校驗(yàn)是一個(gè)好的選擇。 [/p] [p]在使用asp來(lái)進(jìn)行后端的數(shù)據(jù)合法性校驗(yàn)的時(shí)候,有些人為滿足不同環(huán)境下面的數(shù)據(jù)校驗(yàn),編寫了很多的函數(shù)來(lái)實(shí)現(xiàn),比如,我們想要校驗(yàn)用戶輸入的url 地址是否合法,是可以自己編寫一段代碼來(lái)逐個(gè)逐個(gè)字符的分析用戶輸入的信息,要分析的信息量小了,那還比較好辦,若是分析的條件千變?nèi)f化,那可就慘了,不但要編寫很長(zhǎng)很繁瑣的代碼,而且運(yùn)行的效率極其低下,有沒(méi)有好的解決辦法呢?有,那就是vbscritp5.0提供的“正則表達(dá)式”對(duì)象,只要你的服務(wù)器安裝了ie5.x,就會(huì)帶vbscript5.0。其實(shí),“正則表達(dá)式”原本是unix下面的專利,尤其是在perl語(yǔ)言中使用的最為廣泛,正是由于“正則表達(dá)式”的強(qiáng)大功能,才使得微軟慢慢將正則表達(dá)式對(duì)象移植到了視窗系統(tǒng)上面,利用 [/p] [p]“正則表達(dá)式”對(duì)象,我們就可以非常方便的對(duì)各種數(shù)據(jù)進(jìn)行合法性的校驗(yàn)了。 [/p] [p]首先,讓我們來(lái)了解一下究竟什么是vbscript的“正則表達(dá)式”對(duì)象,我們先來(lái)看一段程序: [/p] [p]function checkexp(patrn, strng) [/p] [p]dim regex, match ' 建立變量。 [/p] [p]set regex = new regexp ' 建立正則表達(dá)式。 [/p] [p]regex.pattern = patrn ' 設(shè)置模式。 [/p] [p]regex.ignorecase = true ' 設(shè)置是否區(qū)分字符大小寫。 [/p] [p]regex.global = true ' 設(shè)置全局可用性。 [/p] [p]matches = regex.test(strng) ' 執(zhí)行搜索。 [/p] [p]checkexp = matches [/p] [p]end function [/p] [p]在這段程序程序中,我們看到可以使用“new regexp”來(lái)得到一個(gè)正則表達(dá)式對(duì)象,然后對(duì)這個(gè)對(duì)象進(jìn)行正則匹配模板的賦值,也就是告訴正則表達(dá)式對(duì)象,你想要匹配一個(gè)什么樣子的模板,然后使用方法test來(lái)檢測(cè)待處理的數(shù)據(jù)究竟和我們給出的模版是否相匹配,如果不匹配,那就表明待處理的數(shù)據(jù)不是合法的數(shù)據(jù),從而也就實(shí)現(xiàn)了數(shù)據(jù)合法性的校驗(yàn),我們可以看出,使用一個(gè)設(shè)計(jì)合理的匹配模板,我們可以輕松的校驗(yàn)一批格式類似的數(shù)據(jù)信息。 [/p] [p]當(dāng)然,vbscript5.0中的“正則表達(dá)式”對(duì)象還有很多的其他的方法和屬性,比如方法replace(),利用他我們就可以很快的實(shí)現(xiàn)現(xiàn)在網(wǎng)上很時(shí)髦的ubb風(fēng)格的論壇以及bbs,這不在我們討論范圍之內(nèi),以后再加以論述,我們現(xiàn)在就看看在數(shù)據(jù)校驗(yàn)方面正則表達(dá)式對(duì)象常用的方法和屬性: [/p] [p][/p] [p]常用方法: execute 方法 [/p] [p]描述:對(duì)指定的字符串執(zhí)行正則表達(dá)式搜索。 [/p] [p]語(yǔ)法:object.execute(string) execute 方法的語(yǔ)法包括以下幾個(gè)部分: [/p] [p]object:必需的??偸且粋€(gè) regexp 對(duì)象的名稱。 [/p] [p]string:必需的。要在其上執(zhí)行正則表達(dá)式的文本字符串。 [/p] [p]說(shuō)明:正則表達(dá)式搜索的設(shè)計(jì)模式是通過(guò) regexp 對(duì)象的 pattern 來(lái)設(shè)置的。execute 方法返回一個(gè) [/p] [p]matches 集合,其中包含了在 string 中找到的每一個(gè)匹配的 match 對(duì)象。如果未找到匹配,execute 將返回空的 matches 集合。 [/p] [p]test方法 [/p] [p]描述:對(duì)指定的字符串執(zhí)行一個(gè)正則表達(dá)式搜索,并返回一個(gè) boolean 值指示是否找到匹配的模式。 [/p] [p]語(yǔ)法:object.test(string) [/p] [p]test 方法的語(yǔ)法包括以下幾個(gè)部分: [/p] [p]object:必需的??偸且粋€(gè) regexp 對(duì)象的名稱。 [/p] [p]string:必需的。要執(zhí)行正則表達(dá)式搜索的文本字符串。 [/p] [p][/p] [p]說(shuō)明:正則表達(dá)式搜索的實(shí)際模式是通過(guò)regexp對(duì)象的pattern屬性來(lái)設(shè)置的。regexp.global屬性對(duì)test方法沒(méi)有影響。如果找到了匹配的模式,test方法返回true;否則返回false。 [/p] [p][/p] [p]常用屬性: global屬性 [/p] [p]描述:設(shè)置或返回一個(gè) boolean 值,該值指明在整個(gè)搜索字符串時(shí)模式是全部匹配還是只匹配第一個(gè)。 [/p] [p]語(yǔ)法:object.global [= true | false ] [/p] [p]object 參數(shù)總是 regexp 對(duì)象。如果搜索應(yīng)用于整個(gè)字符串,global 屬性的值為 true,否則其值為 false。默認(rèn)的設(shè)置為 true。 [/p] [p]ignorecase屬性 [/p] [p]描述:設(shè)置或返回一個(gè)boolean值,指明模式搜索是否區(qū)分大小寫。 [/p] [p]語(yǔ)法:object.ignorecase [= true | false ] [/p] [p]object 參數(shù)總是一個(gè) regexp 對(duì)象。如果搜索是區(qū)分大小寫的,則 ignorecase 屬性為 false;否則為 true。缺省值為 true。 [/p] [p]pattern屬性 [/p] [p]描述:設(shè)置或返回被搜索的正則表達(dá)式模式。 這是一個(gè)最重要的屬性,我們主要是設(shè)置這個(gè)屬性來(lái)實(shí)現(xiàn)數(shù)據(jù)校驗(yàn)的。 [/p] [p]語(yǔ)法:object.pattern [= "searchstring"] [/p] [p]pattern 屬性的語(yǔ)法包含以下幾個(gè)部分: [/p] [p]object:必需的??偸且粋€(gè) regexp 對(duì)象變量。 [/p] [p]searchstring:可選的。被搜索的正則字符串表達(dá)式。它可能包含設(shè)置部分表格中的各種正則表達(dá)式字符。 [/p] [p]設(shè)置:在書(shū)寫正則表達(dá)式的模式時(shí)使用了特殊的字符和序列。下表描述了可以使用的字符和序列,并給出了實(shí)例。 [/p] [p][/p] [p]字符描述: \:將下一個(gè)字符標(biāo)記為特殊字符或字面值。例如"n"與字符"n"匹配。"\n"與換行符匹配。序列"\\"與"\"匹配,"\("與"("匹配。 [/p] [p]^ :匹配輸入的開(kāi)始位置。 [/p] [p]$ :匹配輸入的結(jié)尾。 [/p] [p]* :匹配前一個(gè)字符零次或幾次。例如,"zo*"可以匹配"z"、"zoo"。 [/p] [p]+ :匹配前一個(gè)字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。 [/p] [p]? :匹配前一個(gè)字符零次或一次。例如,"a?ve?"可以匹配"never"中的"ve"。 [/p] [p].:匹配換行符以外的任何字符。 [/p] [p](pattern) 與模式匹配并記住匹配。匹配的子字符串可以從作為結(jié)果的 matches 集合中使用 item [0]...[n]取得。如果要匹配括號(hào)字符(和 ),可使用"\(" 或 "\)"。 [/p] [p]x|y:匹配 x 或 y。例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zoo" 或 "food"。 [/p] [p]{n}:n 為非負(fù)的整數(shù)。匹配恰好n次。例如,"o{2}" 不能與 "bob 中的 "o" 匹配,但是可以與"foooood"中的前兩個(gè)o匹配。 [/p] [p]{n,} :n 為非負(fù)的整數(shù)。匹配至少n次。例如,"o{2,}"不匹配"bob"中的"o",但是匹配"foooood"中所有的o。"o{1,}"等價(jià)于"o+"。"o{0,}"等價(jià)于"o*"。 [/p] [p]{n,m} :m 和 n 為非負(fù)的整數(shù)。匹配至少 n 次,至多 m 次。例如,"o{1,3}" 匹配 "fooooood"中前三個(gè)o。"o{0,1}"等價(jià)于"o?"。 [/p] [p][xyz] :一個(gè)字符集。與括號(hào)中字符的其中之一匹配。例如,"[abc]" 匹配"plain"中的"a"。 [/p] [p][^xyz] :一個(gè)否定的字符集。匹配不在此括號(hào)中的任何字符。例如,"[^abc]" 可以匹配"plain"中的"p". [/p] [p][a-z] :表示某個(gè)范圍內(nèi)的字符。與指定區(qū)間內(nèi)的任何字符匹配。例如,"[a-z]"匹配"a"與"z"之間的任何一個(gè)小寫字母字符。 [/p] [p][^m-z] :否定的字符區(qū)間。與不在指定區(qū)間內(nèi)的字符匹配。例如,"[m-z]"與不在"m"到"z"之間的任何字符匹配。 [/p] [p]\b :與單詞的邊界匹配,即單詞與空格之間的位置。例如,"er\b" 與"never"中的"er"匹配,但是不匹配"verb"中的"er"。 [/p] [p]\b :與非單詞邊界匹配。"ea*r\b"與"never early"中的"ear"匹配。 [/p] [p]\d :與一個(gè)數(shù)字字符匹配。等價(jià)于[0-9]。 [/p] [p]\d :與非數(shù)字的字符匹配。等價(jià)于[^0-9]。 [/p] [p]\f :與分頁(yè)符匹配。 [/p] [p]\n :與換行符字符匹配。 [/p] [p]\r :與回車字符匹配。 [/p] [p]\s :與任何白字符匹配,包括空格、制表符、分頁(yè)符等。等價(jià)于"[ \f\n\r\t\v]"。 [/p] [p]\s :與任何非空白的字符匹配。等價(jià)于"[^ \f\n\r\t\v]"。 [/p] [p]\t :與制表符匹配。 [/p] [p]\v :與垂直制表符匹配。 [/p] [p]\w :與任何單詞字符匹配,包括下劃線。等價(jià)于"[a-za-z0-9_]"。 [/p] [p]\w :與任何非單詞字符匹配。等價(jià)于"[^a-za-z0-9_]"。 [/p] [p]\num :匹配 num個(gè),其中 num 為一個(gè)正整數(shù)。引用回到記住的匹配。例如,"(.)\1"匹配兩個(gè)連續(xù)的相同的字符。 [/p] [p]\n:匹配 n,其中n 是一個(gè)八進(jìn)制換碼值。八進(jìn)制換碼值必須是 1, 2 或 3 個(gè)數(shù)字長(zhǎng)。 [/p] [p]例如,"\11" 和 "\011" 都與一個(gè)制表符匹配。"\0011"等價(jià)于"\001" 與 "1"。八進(jìn)制換碼值不得超過(guò) 256。否則,只有前兩個(gè)字符被視為表達(dá)式的一部分。允許在正則表達(dá)式中使用ascii碼。 [/p] [p]\xn:匹配n,其中n是一個(gè)十六進(jìn)制的換碼值。十六進(jìn)制換碼值必須恰好為兩個(gè)數(shù)字長(zhǎng)。例如,"\x41"匹配"a"。"\x041"等價(jià)于"\x04" 和 "1"。允許在正則表達(dá)式中使用 ascii 碼。 [/p] [p]好了,常用的方法和屬性就是這些了,上面的語(yǔ)法介紹的已經(jīng)很詳細(xì)了,我們就沒(méi)有必要在羅嗦了,接下來(lái)我們來(lái)看看在具體的例子里面如何使用這些方法和屬性來(lái)校驗(yàn)數(shù)據(jù)的合法性,我們還是舉個(gè)例子吧,比如,我們想要對(duì)用戶輸入的電子郵件進(jìn)行校驗(yàn),那么,什么樣的數(shù)據(jù)才算是一個(gè)合法的電子郵件呢?我可以這樣輸入:uestc95@263.net,當(dāng)然我也會(huì)這樣輸入:xxx@yyy.com.cn,但是這樣的輸入就是非法的:xxx@@com.cn或者@xxx.com.cn,等等,所以我們得出一個(gè)合法的電子郵件地址至少應(yīng)當(dāng)滿足以下幾個(gè)條件: [/p] [p]1. 必須包含一個(gè)并且只有一個(gè)符號(hào)“@” [/p] [p]2. 必須包含至少一個(gè)至多三個(gè)符號(hào)“.” [/p] [p]3. 第一個(gè)字符不得是“@”或者“.” [/p] [p]4. 不允許出現(xiàn)“@.”或者.@ [/p] [p]5. 結(jié)尾不得是字符“@”或者“.” [/p] [p]所以根據(jù)以上的原則和上面表中的語(yǔ)法,我們很容易的就可以得到需要的模板如下:"(\w)+[@]{1}(\w)+[.]{1,3}(\w)+" [/p] [p]接下來(lái)我們仔細(xì)分析一下這個(gè)模板,首先“\w”表示郵件的開(kāi)始字符只能是包含下劃線的單詞字符,這樣,滿足了第三個(gè)條件;“[@]{1}”表示在電子郵件中應(yīng)當(dāng)匹配并且只能匹配一次字符“@”,滿足了條件一;同樣的“[.]{1,3}”表示在電子郵件中至少匹配1個(gè)至多匹配3個(gè)字符“.” ,滿足了第二個(gè)條件;模板最后的“(\w)+”表示結(jié)尾的字符只能是包含下劃線在內(nèi)的單詞字符,滿足了條件五;模板中間的“(\w)+”滿足了條件四。 [/p] [p]然后,我們就直接調(diào)用剛才的那個(gè)函數(shù)checkexp("(\w)+[@]{1}(\w)+[.]{1}(\w)+",待校驗(yàn)的字符串)就好了,如果返回true就表示數(shù)據(jù)是合法的,否則就是不正確的,怎么樣,簡(jiǎn)單吧。我們還可以寫出來(lái)校驗(yàn)身份證號(hào)碼的模板:"([0-9]){15}";校驗(yàn)url的模板:"^http://{1}((\w)+[.]){1,3}"等等;我們可以看到,這些模板為我們提供了很好的可重利用的模塊,利用自己或者別人提供的各種模板,我們就可以方便快捷的進(jìn)行數(shù)據(jù)的合法性校驗(yàn)了,相信你一定會(huì)寫出非常通用的模板的。 [/p] [p]這樣,我們只要定制不同的模板,就可以實(shí)現(xiàn)對(duì)不同數(shù)據(jù)的合法性校驗(yàn)了。所以,正則表達(dá)式對(duì)象中最重要的屬性就是:“pattern”屬性,只要真正掌握了這個(gè)屬性,才可以自由的運(yùn)用正則表達(dá)式對(duì)象來(lái)為我們的數(shù)據(jù)校驗(yàn)進(jìn)行服務(wù)。[/p] 該文章在 2011/4/19 11:00:18 編輯過(guò) |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |