前面的話
正則表達式在人們的印象中可能是一堆無法理解的字符,但就是這些符號卻實現(xiàn)了字符串的高效操作。通常的情況是,問題本身并不復雜,但沒有正則表達式就成了大問題。javascript中的正則表達式作為相當重要的知識,本文將介紹正則表達式的基礎語法
定義
正則表達式(Regular Expression)是一門簡單語言的語法規(guī)范,是強大、便捷、高效的文本處理工具,它應用在一些方法中,對字符串中的信息實現(xiàn)查找、替換和提取操作
javascript中的正則表達式用RegExp對象表示,有兩種寫法:一種是字面量寫法;另一種是構(gòu)造函數(shù)寫法
正則表達式用來處理字符串特別好用,在JavaScript中能用到正則表達式的地方有很多,本文對正則表達式基礎知識和Javascript中正則表達式的使用做一個總結(jié)。
第一部分簡單列舉了正則表達式在JavaScript中的使用場景;第二部分詳細介紹正則表達式的基礎知識,寫出一些例子方便理解。
本文的內(nèi)容是我自己看完正則表達式寫法,和犀牛書中js正則表達式的章節(jié)后的總結(jié),所以內(nèi)容可能會有疏漏和不嚴謹?shù)牡胤健H粲写笊衤愤^發(fā)現(xiàn)文中錯誤的地方,歡迎斧正!
Javascript中正則表達式的使用
一個正則表達式可以認為是對一種字符片段的特征描述,而它的作用就是從一堆字符串中找出滿足條件的子字符串。比如我在JavaScript中定義一個正則表達式:
那么這個正則表達式可以用來從一堆字符串中找出 hello 這個單詞。而“找出”這個動作,其結(jié)果可能是找出第一個hello的位置、用別的字符串替換hello、找出所有hello等等。下面就列舉一下JavaScript中可以使用正則表達式的函數(shù),簡單介紹一下這些函數(shù)的作用,更復雜的用法會在第二部分中介紹。
String.prototype.search方法
用來找出原字符串中某個子字符串首次出現(xiàn)的index,沒有則返回-1
String.prototype.replace方法
用來替換字符串中的子串
String.prototype.split方法
用來分割字符串
String.prototype.match方法
用來捕獲字符串中的子字符串到一個數(shù)組中。默認情況下只捕獲一個結(jié)果到數(shù)組中,正則表達式有”全局捕獲“的屬性時(定義正則表達式的時候添加參數(shù)g),會捕獲所有結(jié)果到數(shù)組中
作為match參數(shù)的正則表達式在是否擁有全局屬性的情況下,match方法的表現(xiàn)還不一樣,這一點會在后邊的正則表達式分組中講到。
RegExp.prototype.test方法
用來測試字符串中是否含有子字符串
RegExp.prototype.exec方法
和字符串的match方法類似,這個方法也是從字符串中捕獲滿足條件的字符串到數(shù)組中,但是也有兩個區(qū)別。
1. exec方法一次只能捕獲一份子字符串到數(shù)組中,無論正則表達式是否有全局屬性
2. 正則表達式對象(也就是JavaScript中的RegExp對象)有一個lastIndex屬性,用來表示下一次從哪個位置開始捕獲,每一次執(zhí)行exec方法后,lastIndex就會往后推,直到找不到匹配的字符返回null,然后又從頭開始捕獲。 這個屬性可以用來遍歷捕獲字符串中的子串。
正則表達式基礎
元字符
上面第一節(jié)以/hello/為例,但是實際應用中可能會遇到這樣的需求: 匹配一串不確定的數(shù)字、匹配開始的位置、匹配結(jié)束的位置、匹配空白符。此時就可以用到元字符。
元字符:
反義元字符,寫法就是把上面的小寫字母變成大寫的,比如 , 匹配所有不是數(shù)字的字符: \D
另外還有一些用來表示重復的元字符,會在下面的內(nèi)容中介紹。
字符范圍
在 [] 中使用符號 - ,可以用來表示字符范圍。如:
重復 & 貪婪與懶惰
首先來講重復,當我們希望匹配一些重復的字符時,就需要用到一些和重復相關(guān)的正則表達式,寫法如下
從上面的結(jié)果可以看到,字符test后邊跟著的數(shù)字可以重復0次或多次時,正則表達式捕獲的子字符串會返回盡量多的數(shù)字,比如/test\d*/匹配 test123 ,返回的是test123,而不是test或者test12。
正則表達式捕獲字符串時,在滿足條件的情況下捕獲盡可能多的字符串,這就是所謂的“貪婪模式”。
對應的”懶惰模式“,就是在滿足條件的情況下捕獲盡可能少的字符串,使用懶惰模式的方法,就是在字符重復標識后面加上一個 "?",寫法如下
字符轉(zhuǎn)義
在正則表達式中元字符是有特殊的含義的,當我們要匹配元字符本身時,就需要用到字符轉(zhuǎn)義,比如:
/\./.test("."); // true
分組 & 分支條件
正則表達式可以用 " () " 來進行分組,具有分組的正則表達式除了正則表達式整體會匹配子字符串外,分組中的正則表達式片段也會匹配字符串。
分組按照嵌套關(guān)系和前后關(guān)系,每個分組會分配得到一個數(shù)字組號,在一些場景中可以用組號來使用分組。
在 replace、match、exec函數(shù)中,分組都能體現(xiàn)不同的功能。
replace函數(shù)中,第二個參數(shù)里邊可以用 $+數(shù)字組號來指代第幾個分組的內(nèi)容,如:
" the best language in the world is java ".replace(/(java)/,"$1script"); // " the best language in the world is javascript "
"/static/app1/js/index.js".replace(/(\/\w+)\.js/,"$1-v0.0.1.js"); //"/static/app1/js/index-v0.0.1.js" (\/\w+)分組匹配的就是 /index ,
在第二個參數(shù)中為其添加上版本號
match函數(shù)中,當正則表達式有全局屬性時,會捕獲所有滿足正則表達式的子字符串
但是當正則表達式?jīng)]有全局屬性,且正則表達式中有分組的時候,match函數(shù)只會返回整個正則表達式匹配的第一個結(jié)果,同時會將分組匹配到的字符串也放入結(jié)果數(shù)組中:
exec函數(shù)在正則表達式中有分組的情況下,表現(xiàn)和match函數(shù)很像,只是無論正則表達式是否有全局屬性,exec函數(shù)都只返回一個結(jié)果,并捕獲分組的結(jié)果
當正則表達式需要匹配幾種類型的結(jié)果時,可以用到分支條件,例如
注意,分支條件影響它兩邊的所有內(nèi)容, 比如 hi|hello 匹配的是hi或者hello,而不是 hiello 或者 hhello
分組中的分支條件不會影響分組外的內(nèi)容
后向引用
正則表達式的分組可以在其后邊的語句中通過 \+數(shù)字組號來引用
比如
斷言
(?:exp) , 用此方式定義的分組,正則表達式會匹配分組中的內(nèi)容,但是不再給此分組分配組號,此分組在replace、match等函數(shù)中的作用也會消失,效果如下:
(?=exp) 這個分組用在正則表達式的后面,用來捕獲exp前面的字符,分組中的內(nèi)容不會被捕獲,也不分配組號
(?!exp) 和前面的斷言相反,用在正則表達式的后面,捕獲后面不是exp的字符,同樣不捕獲分組的內(nèi)容,也不分配組號
處理選項
javascript中正則表達式支持的正則表達式有三個,g、i、m,分別代表全局匹配、忽略大小寫、多行模式。三種屬性可以自由組合共存。
在默認的模式下,元字符 ^ 和 $ 分別匹配字符串的開頭和結(jié)尾處,模式 m 改變了這倆元字符的定義,讓他們匹配一行的開頭和結(jié)尾
總結(jié)
以上所述是小編給大家介紹的Javascript中正則表達式的使用及基本語法,希望對大家有所幫助!!
相關(guān)推薦:
深入分析正則表達式的子模式
正則表達式中最短匹配模式的用法
使用正則表達式屏蔽關(guān)鍵字的方法
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com