首页 > 前端 > javascript正则表达式

javascript正则表达式

前言

正则表达式( Regular Expressions)是用来匹配字符串中的字符组合的模式,通过这个模式我们可以进行字符串的搜索和替换等操作。ECMAScript通过RegExp类型来支持正则表达式,当然,String 对象中也有多个方法支持正则表达式操作。

 

语法

 创建正则表达式

在javascript中创建正则表达式有两种方式:

1.通过字面量:

let expression = /pattern / attributes;

2.通过RegExp构造函数:

new RegExp(pattern,attributes);

其中:

“pattern”为正则表达式的内容,包含你要查询的字符串,语义符等等。

“attributes”为正则表达式的模式,常用值:

  • g:全局模式
  • i:不区分大小写模式
  • m:多行模式

 

 元字符

正则表达式语言由两种基本字符类型组成:原义字符和元字符,其中元字符就是指那些在正则表达式中具有特殊意义(功能)的专用字符。

下面是一些常用的字符及对应含义:

字符 含义
\ 反斜杠,可以将在其后的字面量字符,转义为特殊字符。也可以将其后的特殊字符,转义为字面量。
^ 匹配字符串的开始。
$ 匹配字符串的结束。
* 匹配前一个字符0次或者是多次,和{0,}有相同的效果。
+ 匹配前面一个字符1次或者多次,和{1,}有相同的效果。
? 匹配前面一个字符0次或者1次,和{0,1}有相同的效果。
. 匹配除了换行符(\n)之外的任何单个字符。
x|y 匹配‘x’或者‘y’。
[xy] 匹配方括号的中任意字符。你可以使用破折号(-)来指定一个字符范围。
\f 匹配一个换页符 (U+000C)。
\n 匹配一个换行符 (U+000A)。
\r 匹配一个回车符 (U+000D)。
\s 匹配一个空白字符,包括空格、制表符、换页符和换行符,相当于[ \t\n\x0B\f\r]。
\S 匹配一个非空白字符,相当于[^ \t\n\x0B\f\r]。
\d 匹配一个数字,相当于[0-9]。
\D 匹配一个非数字字符,相当于[^0-9]。
\w 匹配一个单字字符(字母、数字或者下划线),相当于[A-Za-z0-9_]。
\W 匹配一个非单字字符。相当于[^A-Za-z0-9_]。

 

RegExp 对象的方法

在javascript中,RegExp对象预定义了一些属性和方法。

 test()方法

用于检索字符串是否匹配指定的值,如果找到则返回 true 否则返回 false。

在下面例子中,我们检索字符串str中的”World”:

let str = "Hello World"
let pattern = new RegExp("World","g")
pattern.test(str) // true

运行后可以看到弹窗返回的结果为“true”。

 exec()方法

用于检索字符串是否匹配指定的值,如果找到则返回一个数组(记录首个匹配信息而非所有命中),否则返回null。

在下面例子中,同样检索字符串str中的”World”:

let str = "Hello World, Hello World."
let pattern = new RegExp("World","g")
pattern.exec(str) // [ 0: "World", index6, xxx: ...] 6为命中起始index,此时会记录lastIndex
pattern.lastIndex // 11

11为下一次检索开始的位置(这里是 ,)。

 

String 对象中的方法

除了RegExp对象外,String 对象中也有多个方法支持正则表达式操作。

 search()方法

用于检索指定字符串并返回匹配字段的起始位置。

在下面例子中,检索字符串str中的”World”,并返回第一个匹配的位置信息:

let str = "Hello World"
str.search(/World/g) // 6

运行后返回结果是“6”,即为检索子字符串“World”的首字符“W”的位置。

 replace()方法

用于字符替换。

在下面例子中,替换字符串str中的”World”为“China”:

let str = "Hello World"
str.replace(/World/g, "China") // Hello China

有的时候为了安全起见,我们需要对用户输入的内容进行转义,例如去除分号,引号等等特殊符号,我们可以用正则这样做:

let username = "T&aylor;+ Swift@#)"
username.replace(/[^A-Za-z\d\s]/g, "") //Taylor Swift

这个例子中用户输入的字符串为“T&aylor;+ Swift@#)”,经过我们的正则转换后,变成了正常的字符串:“Taylor Swift”

 split()方法

用于把字符串分割成子字符串数组。

在下面这个例子中,我们模拟用户一次性输入多个名字(用空格隔开),然后要通过正则把它转换成数组:

let str = "Monica Sophie Julia <em>Kathy</em>"
str.split(/\s/g)

运行后输出数组的所有元素:“Monica,Sophie,Julia,Kathy”

 match()方法

用于检索匹配值,同样返回一个数组。

在下面这个例子中,我们在一个单词里面寻找字母‘a’:

let word = "international"
word.match(/a/g) // "a,a"

字母‘a’在单词‘international’中出现了两次,所以运行后输出匹配数组:“a,a”。

 

常用的正则表达式 (来自JavaScript中文网)

 1.匹配数字和字符串

· 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$

· 只能输入数字:”^[0-9]*$”。

· 只能输入n位的数 字:”^\d{n}$”。

· 只能输入至少n位的数字:”^\d{n,}$”。

· 只能输入m~n位的数字:。”^\d{m,n}$”

· 只 能输入零和非零开头的数字:”^(0|[1-9][0-9]*)$”。

· 只能输入有两位小数的正实数:”^[0-9]+(.[0-9] {2})?$”。

· 只能输入有1~3位小数的正实数:”^[0-9]+(.[0-9]{1,3})?$”。

· 只能输入非零的正整 数:”^\+?[1-9][0-9]*$”。

· 只能输入非零的负整数:”^\-[1-9][]0-9″*$。

· 只能输入长度为3的字 符:”^.{3}$”。

· 只能输入由26个英文字母组成的字符串:”^[A-Za-z]+$”。

· 只能输入由26个大写英文字母组成的字 符串:”^[A-Z]+$”。

· 只能输入由26个小写英文字母组成的字符串:”^[a-z]+$”。

· 只能输入由数字和26个英文字母组 成的字符串:”^[A-Za-z0-9]+$”。

· 只能输入由数字、26个英文字母或者下划线组成的字符串:”^\w+$”。

 

 2.验证用户信息

· 验证用户 密码:”^[a-zA-Z]\w{5,17}$”正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。

· 验证是否含有 ^%&’,;=?$\”等字符:”[^%&’,;=?$\x22]+”。

· 只能输入汉字:”^[\u4e00-\u9fa5] {0,}$”

· 验证Email地址:”^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”。

· 验 证InternetURL:”^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$”。

· 验证手机号:”^1(3|4|5|7|8)\d{9}$”

· 验证电话号 码:”^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$”正确格式为:”XXX-XXXXXXX”、”XXXX- XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX”。

· 验证身份证号 (15位或18位数字):”^\d{15}|\d{18}$”。

· 验证一年的12个月:”^(0?[1-9]|1[0-2])$”正确格式 为:”01″~”09″和”1″~”12″。

· 验证一个月的31天:”^((0?[1-9])|((1|2)[0-9])|30|31)$”正确 格式为;”01″~”09″和”1″~”31″。

 

 3.匹配中文和其他特殊字符

· 匹配中文字符的正则表达式: [\u4e00-\u9fa5]

· 匹配双字节字符(包括汉字在内):[^\x00-\xff]

· 匹配空行的正则表达式:\n[\s| ]*\r

· 匹配html标签的正则表达式:<[^>]+>

· 匹配首尾空格的正则表达式:(^\s*)|(\s*$)

 

参考资料:

《JavaScript高级程序设计》(第3版)

MDN  正则表达式

 


本文标题:javascript正则表达式
转载请注明出处,欢迎分享