几个单词
Regular ['regjʊlə] adj. 定期的;有规律的
Expression [ɪk'spreʃ(ə)n; ek-] n. 表现,表示
Regular expression 正则表达式
什么是正则表达式?
用一个描述字符串去验证另一个字符串是否符合描述字符串的特征。(不严谨,可以这么理解)
思考:比如表达式“12+”,描述的意思是一个1和任意个2组成的字符串,那么'12'、’122‘、'122'….都符合描述特征
正则表达式用来干嘛?
常用到的几种方式:
1、验证字符串是否符合指定要求:比如验证邮箱格式、密码个数等等
2、查找符合指定要求的字符串,这个比从父串中查找子串方便太多
3、替换,更强大
思考:正则的用途无非2种,验证、字符串的处理(查找、替换、删除之类)
正则表达式的基础知识
一、单种匹配,匹配一次
1、普通字符:字母、数字、汉字、下划线、没有特殊定义的标点
举例::表达式"c",匹配字符串"adasc",匹配结果:"c",匹配位置:始于4,结束于5
2、转义字符:有特殊意义的字符,采用前面‘\+字母’的方式替换原字符
表达式
匹配特征
\r
回车
\n
换行符
\t
制表符
\\
代表\本身
\^
匹配^本身
\$
匹配$本身
\.
匹配.本身
举例:表达式"\$d",在匹配字符串"sas$d132",匹配结果:"$d",匹配位置:始于3,结束于5
二、多种匹配,匹配一次
1、固定的多种匹配(匹配一次)
表达式
匹配特征
\d
0~9的任意一个
\w
A-Z,a-z,0-9,_ 中的任意一个
\s
空格、制表符、换页符的任意一个
.
匹配除了\n外的任意一个
举例:表达式"a.\d",匹配"123ab11d",匹配结果:"ab1",匹配位置:始于3,结束于6
2、自定义的多种匹配(匹配一次)
使用方括号[],意思是匹配方括号里面的任意一个字符,[^]那就是匹配方括号里面字符以外的任意一个字符
表达式
匹配特征
[abc1]
"a"、"b"、"c"、"1"中的任意一个字符
[^abc]
除了"a"、"b"、"c"以外的任意一个字符
[a-f]
a到f之间任意一个字符
[^a-f]
除了a到f之间以外的任意一个字符
举例:表达式"[^123][456]",匹配"12345678",匹配的结果"45",匹配位置:始于3,结束于5
思考:理解[]代表其中任意一个字符,^代表字符以外的任意字符即可
三、多种匹配,匹配多次
如果想要实现多次匹配,那么就要告诉描述的表达式你想要匹配几次,这个东西就是"次数修饰",有一点需要注意的是"次数修饰"放到"被修饰的表达式"后面
表达式
匹配特征
{n}
匹配n次
{m,n}
匹配m~n之间的次数
{m,}
匹配 >=m 次
?
匹配 0~1中间的次数
*
匹配 >=0次
+
匹配 >=1 次
举例:表达式"\d?[ab]*",匹配"abc123",匹配结果:"ab"匹配始于0,结束于2
思考:次数修饰符放到表达式后面用以表示重复的次数即可
四、特殊匹配
表达式
意义
^
与字符串开始的地方匹配
$
与字符串结束的地方匹配
\b
匹配一个单词的边界,也就是单词和空格之间的位置(不匹配任何字符,一边是\w,一边是非\w)
|
前后2个表达式是"或"的关系
()
1、在被修饰匹配次数的时候,括号代表一个整体
2、去匹配结果的时候,括号内的匹配内容可以被单独取到
举例1:表达式"\bstart\b",匹配"go,start,end",匹配结果是"start"
举例2:表达式"(go)+",匹配"let's gogo",匹配结果是"go go"
举例3:表达式"$(\d+\.\d*)",匹配"$12.33",匹配结果"$12.33"。单独获取括号里面的内容:"12.33"
评论