正则表达式笔记
时间:2008-03-25 来源:yl2003215059
一、正则表达式定义:
一个正则表达式就是用来在一次搜索中匹配相同字符的一个字符模式。在大多数的程序中,把一个正则表达式封装在正斜杠(/)里面。
二、常用到的格式:
^ /^love/ 与所有love开头的行相匹配。
$ /love$/ 与所有love结尾的行相匹配。
. /l..e/ 一个l ,后面跟2个字符,然后是一个e.
* / *love/ 跟0个或者多个空格后面的love模式相匹配。
[ ] /[Ll]ove/ 与其中一个相匹配,即love或者Love的行匹配。
[a-z] /[a-z]ove/ 任意字母跟ove都匹配。
[^] /[^a-z]ove/ 不包括a到z,后面跟ove的字相匹配。所以开头的就不是字母。
/to|too|2/ “或”运算,在多个不同的模式中任选一个进行匹配的话,可以使用管道符 “|”。
上述正则表达式将会与目标对象中的 “to”, “too”, 或 “2” 相匹配。
[ S s ] i g n a [ l L ] 对匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L
[Ss]igna[lL]\. 对同上,但加一句点
[ m a y M A Y ] 对包含m a y大写或小写字母的行
^ U S E R $ 对只包含U S E R的行
[tty]$ 对以t t y结尾的行
\ . 对带句点的行
^ d . . x . . x . . x 对对用户、用户组及其他用户组成员有可执行权限的目录
^ [ ^ l ] 对排除关联目录的目录列表
[ 0 0 0 * ] 对0 0 0或更多个
[ iI] 对大写或小写I
[ i I ] [ n N ] 对大写或小写i或n
[ ^ $ ] 对空行
[ ^ . * $ ] 对匹配行中任意字符串
^ . . . . . . $ 对包括6个字符的行
[a- zA-Z] 对任意单字符
[ a - z ] [ a - z ] * 对至少一个小写字母
[ ^ 0 - 9 \ $ ] 对非数字或美元标识
[ ^ 0 - 0 A - Z a - z ] 对非数字或字母
[ 1 2 3 ] 对1到3中一个数字
[ D d ] e v i c e 对单词d e v i c e或D e v i c e
D e . . c e 对前两个字母为D e,后跟两个任意字符,最后为c e
\ ^ q 对以^ q开始行
^ . $ 对仅有一个字符的行
^\.[0-9][0-9] 对以一个句点和两个数字开始的行
' " D e v i c e " ' 对单词d e v i c e
D e [ V v ] i c e \ . 对单词D e v i c e或d e v i c e
[ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 4 \ } 对日期格式d d - m m - y y y y
[ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } 对I P地址格式nnn. nnn.nnn.nnn
[ ^ . * $ ] 对匹配任意行
三、常用到的例子:
1、匹配Ip=192.168.0.1
可以用正则:/([0-9]*\.)([0-9]*\..)([0-9]*\...)([0-9]*\.)/;
注释:第一个括号是表示0到9个数字任意的写多少个。所以192就匹配。
后面不要忘了还有一个点。
2、匹配日期
2003-01-28 或 2003.10.18 或 2003/10/10 或 2003 10 10
\([0-9]\{4\}[ /-.][0-1][0-9][ /-.][0-3][0-9]\)
注释:0到9的数字匹配的有4个正好是2008之类的年。然后是3种不同的格式。然后月份的匹配,月份由2个数字组成,所以有2个中括号。最后是天。这个也一样的。