正则表达式基本语法详解
正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。
1.正则表达式基本语法
两个特殊的符号'^'和'$'。他们的作用是分别指出一个字符串的开始和结束。例子如下:
"^the":表示所有以"the"开始的字符串("there","the cat"等);
"of despair$":表示所以以"of despair"结尾的字符串;
"^abc$":表示开始和结尾都是"abc"的字符串——呵呵,只有"abc"自己了;
"notice":表示任何包含"notice"的字符串。
象最后那个例子,如果你不使用两个特殊字符,你就在表示要查找的串在被查找串的任意部分——你并
不把它定位在某一个顶端。
其它还有'*','+'和'?'这三个符号,表示一个或一序列字符重复出现的次数。它们分别表示“没有或
更多”,“一次或更多”还有“没有或一次”。下面是几个例子:
"ab*":表示一个字符串有一个a后面跟着零个或若干个b。("a", "ab", "abbb",……);
"ab+":表示一个字符串有一个a后面跟着至少一个b或者更多;
"ab?":表示一个字符串有一个a后面跟着零个或者一个b;
"a?b+$":表示在字符串的末尾有零个或一个a跟着一个或几个b。
你也可以使用范围,用大括号括起,用以表示重复次数的范围。
"ab{2}":表示一个字符串有一个a跟着2个b("abb");
"ab{2,}":表示一个字符串有一个a跟着至少2个b;
"ab{3,5}":表示一个字符串有一个a跟着3到5个b。
请注意,你必须指定范围的下限(如:"{0,2}"而不是"{,2}")。还有,你可能注意到了,'*','+'和
'?'相当于"{0,}","{1,}"和"{0,1}"。
还有一个'¦',表示“或”操作:
"hi¦hello":表示一个字符串里有"hi"或者"hello";
"(b¦cd)ef":表示"bef"或"cdef";
"(a¦b)*c":表示一串"a""b"混合的字符串后面跟一个"c";
'.'可以替代任何字符:
"a.[0-9]":表示一个字符串有一个"a"后面跟着一个任意字符和一个数字;
"^.{3}$":表示有任意三个字符的字符串(长度为3个字符);
方括号表示某些字符允许在一个字符串中的某一特定位置出现:
"[ab]":表示一个字符串有一个"a"或"b"(相当于"a¦b");
"[a-d]":表示一个字符串包含小写的'a'到'd'中的一个(相当于"a¦b¦c¦d"或者"[abcd]");
"^[a-za-z]":表示一个以字母开头的字符串;
"[0-9]%":表示一个百分号前有一位的数字;
",[a-za-z0-9]$":表示一个字符串以一个逗号后面跟着一个字母或数字结束。
你也可以在方括号里用'^'表示不希望出现的字符,'^'应在方括号里的第一位。(如:"%[^a-za-z]%"表
示两个百分号中不应该出现字母)。
为了逐字表达,你必须在"^.$()¦*+?{\"这些字符前加上转移字符'\'。
请注意在方括号中,不需要转义字符。
2.正则表达式验证控制文本框的输入字符类型
1.只能输入数字和英文的:
<input onkeyup="value=value.replace(/[\w]/g,'') " onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\d]/g,''))" id="text1" name="text1">
2.只能输入数字的:
<input onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\d]/g,''))" id="text2" name="text2">
3.只能输入全角的:
<input onkeyup="value=value.replace(/[^\uff00-\uffff]/g,'')" onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\uff00-\uffff]/g,''))" id="text3" name="text3">
4.只能输入汉字的:
<input onkeyup="value=value.replace(/[^\u4e00-\u9fa5]/g,'')" onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\u4e00-\u9fa5]/g,''))" id="text4" name="text4">
3.正则表达式的应用实例通俗说明
*******************************************************************************
//校验是否全由数字组成
/^[0-9]{1,20}$/
^ 表示打头的字符要匹配紧跟^后面的规则
$ 表示打头的字符要匹配紧靠$前面的规则
[ ] 中的内容是可选字符集
[0-9] 表示要求字符范围在0-9之间
{1,20}表示数字字符串长度合法为1到20,即为[0-9]中的字符出现次数的范围是1到20次。
/^ 和 $/成对使用应该是表示要求整个字符串完全匹配定义的规则,而不是只匹配字符串中的一个子串。
*******************************************************************************
//校验登录名:只能输入5-20个以字母开头、可带数字、“_”、“.”的字串
/^[a-za-z]{1}([a-za-z0-9]|[._]){4,19}$/
^[a-za-z]{1} 表示第一个字符要求是字母。
([a-za-z0-9]|[._]){4,19} 表示从第二位开始(因为它紧跟在上个表达式后面)的一个长度为4到9位的字符串,它要求是由大小写字母、数字或者特殊字符集[._]组成。
*******************************************************************************
//校验用户姓名:只能输入1-30个以字母开头的字串
/^[a-za-z]{1,30}$/
*******************************************************************************
//校验密码:只能输入6-20个字母、数字、下划线
/^(\w){6,20}$/
\w:用于匹配字母,数字或下划线字符
*******************************************************************************
//校验普通电话、传真号码:可以“+”或数字开头,可含有“-” 和 “ ”
/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/
\d:用于匹配从0到9的数字;
“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次
可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等
*******************************************************************************
//校验url
/^http[s]{0,1}:\/\/.+$/ 或 /^http[s]{0,1}:\/\/.{1,n}$/ (表示url串的长度为length(“https://”) + n )
\ / :表示字符“/”。
. 表示所有字符的集
+ 等同于{1,},就是1到正无穷吧。
*******************************************************************************
//校验纯中文字符 /^[\u4e00-\u9fa5]+$/ [\u4e00-\u9fa5] :估计是中文字符集的范围吧 以上表达式均在下面的javascript中测试通过 <html> <script language="javascript"> <!-- function regx(r,s) { if (r == null || r == ""){ return false; } var patrn= new regexp(r); if (patrn.exec(s)) return true return false } --> </script> <body> <form> 规则表达式 : <input type="input" name="regxstr" value="" > (填写/ /之间的表达式) <br> 校验字符串 : <input type="input" name="str" value="" > <input type="button" name="match" value="匹配" onclick="alert(regx(regxstr.value,str.value));"> </form> </body> </html>
4.正則表達式應用
"^\d+$" //非负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$" //正整数
"^((-\d+)|(0+))$" //非正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$" //负整数
"^-?\d+$" //整数
"^\d+(\.\d+)?$" //非负浮点数(正浮点数 + 0)
"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数
"^((-\d+(\.\d+)?)|(0+(\.0+)?))$" //非正浮点数(负浮点数 + 0)
"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数
"^(-?\d+)(\.\d+)?$" //浮点数
"^[a-za-z]+$" //由26个英文字母组成的字符串
"^[a-z]+$" //由26个英文字母的大写组成的字符串
"^[a-z]+$" //由26个英文字母的小写组成的字符串
"^[a-za-z0-9]+$" //由数字和26个英文字母组成的字符串
"^\w+$" //由数字、26个英文字母或者下划线组成的字符串
"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$" //email地址
"^[a-za-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$" //url
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年
"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-za-z]{2,4}|[0-9]{1,3})(]?)$" //emil
"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码
"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$" //ip地址
^([0-9a-f]{2})(-[0-9a-f]{2}){5}$ //mac地址的正则表达式
^[-+]?\d+(\.\d+)?$ //值类型正则表达式
5.javascript正则表达式检验
//校验是否全由数字组成 function isdigit(s) { var patrn=/^[0-9]{1,20}$/; if (!patrn.exec(s)) return false return true } //校验登录名:只能输入5-20个以字母开头、可带数字、“_”、“.”的字串 function isregisterusername(s) { var patrn=/^[a-za-z]{1}([a-za-z0-9]|[._]){4,19}$/; if (!patrn.exec(s)) return false return true } //校验用户姓名:只能输入1-30个以字母开头的字串 function istruename(s) { var patrn=/^[a-za-z]{1,30}$/; if (!patrn.exec(s)) return false return true } //校验密码:只能输入6-20个字母、数字、下划线 function ispasswd(s) { var patrn=/^(\w){6,20}$/; if (!patrn.exec(s)) return false return true } //校验普通电话、传真号码:可以“+”开头,除数字外,可含有“-” function istel(s) { //var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?(\d){1,12})+$/; var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/; if (!patrn.exec(s)) return false return true } //校验手机号码:必须以数字开头,除数字外,可含有“-” function ismobil(s) { var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/; if (!patrn.exec(s)) return false return true } //校验邮政编码 function ispostalcode(s) { //var patrn=/^[a-za-z0-9]{3,12}$/; var patrn=/^[a-za-z0-9 ]{3,12}$/; if (!patrn.exec(s)) return false return true } //校验搜索关键字 function issearch(s) { var patrn=/^[^`~!@#$%^&*()+=|\\\][\]\{\}:;\'\,.<>/?]{1}[^`~!@$%^&()+=|\\\][\]\{\}:;\'\,.<>?]{0,19}$/; if (!patrn.exec(s)) return false return true } function isip(s) //by zergling { var patrn=/^[0-9.]{1,20}$/; if (!patrn.exec(s)) return false return true } /********************************************************************************* * function: isbetween * parameters: val as any value * lo as lower limit to check * hi as higher limit to check * calls: nothing * returns: true if val is between lo and hi both inclusive, otherwise false. **********************************************************************************/ function isbetween (val, lo, hi) { if ((val < lo) || (val > hi)) { return(false); } else { return(true); } } /********************************************************************************* * function: isdate checks a valid date * parameters: thestr as string * calls: isbetween, isint * returns: true if thestr is a valid date otherwise false. **********************************************************************************/ function isdate (thestr) { var the1st = thestr.indexof('-'); var the2nd = thestr.lastindexof('-'); if (the1st == the2nd) { return(false); } else { var y = thestr.substring(0,the1st); var m = thestr.substring(the1st+1,the2nd); var d = thestr.substring(the2nd+1,thestr.length); var maxdays = 31; if (isint(m)==false || isint(d)==false || isint(y)==false) { return(false); } else if (y.length < 4) { return(false); } else if (!isbetween (m, 1, 12)) { return(false); } else if (m==4 || m==6 || m==9 || m==11) maxdays = 30; else if (m==2) { if (y % 4 > 0) maxdays = 28; else if (y % 100 == 0 && y % 400 > 0) maxdays = 28; else maxdays = 29; } if (isbetween(d, 1, maxdays) == false) { return(false); } else { return(true); } } } /********************************************************************************* * function: iseudate checks a valid date in british format * parameters: thestr as string * calls: isbetween, isint * returns: true if thestr is a valid date otherwise false. **********************************************************************************/ function iseudate (thestr) { if (isbetween(thestr.length, 8, 10) == false) { return(false); } else { var the1st = thestr.indexof('/'); var the2nd = thestr.lastindexof('/'); if (the1st == the2nd) { return(false); } else { var m = thestr.substring(the1st+1,the2nd); var d = thestr.substring(0,the1st); var y = thestr.substring(the2nd+1,thestr.length); var maxdays = 31; if (isint(m)==false || isint(d)==false || isint(y)==false) { return(false); } else if (y.length < 4) { return(false); } else if (isbetween (m, 1, 12) == false) { return(false); } else if (m==4 || m==6 || m==9 || m==11) maxdays = 30; else if (m==2) { if (y % 4 > 0) maxdays = 28; else if (y % 100 == 0 && y % 400 > 0) maxdays = 28; else maxdays = 29; } if (isbetween(d, 1, maxdays) == false) { return(false); } else { return(true); } } } } /******************************************************************************** * function: compare date! which is the latest! * parameters: lessdate,moredate as string * calls: isdate,isbetween * returns: true if lessdate<moredate *********************************************************************************/ function iscomdate (lessdate , moredate) { if (!isdate(lessdate)) { return(false);} if (!isdate(moredate)) { return(false);} var less1st = lessdate.indexof('-'); var less2nd = lessdate.lastindexof('-'); var more1st = moredate.indexof('-'); var more2nd = moredate.lastindexof('-'); var lessy = lessdate.substring(0,less1st); var lessm = lessdate.substring(less1st+1,less2nd); var lessd = lessdate.substring(less2nd+1,lessdate.length); var morey = moredate.substring(0,more1st); var morem = moredate.substring(more1st+1,more2nd); var mored = moredate.substring(more2nd+1,moredate.length); var date1 = new date(lessy,lessm,lessd); var date2 = new date(morey,morem,mored); if (date1>date2) { return(false);} return(true); } /********************************************************************************* * function isempty checks if the parameter is empty or null * parameter str as string **********************************************************************************/ function isempty (str) { if ((str==null)||(str.length==0)) return true; else return(false); } /********************************************************************************* * function: isint * parameter: thestr as string * returns: true if the passed parameter is an integer, otherwise false * calls: isdigit **********************************************************************************/ function isint (thestr) { var flag = true; if (isempty(thestr)) { flag=false; } else { for (var i=0; i<thestr.length; i++) { if (isdigit(thestr.substring(i,i+1)) == false) { flag = false; break; } } } return(flag); } /********************************************************************************* * function: isreal * parameter: hestr as string declen as integer (how many digits after period) * returns: true if thestr is a float, otherwise false * calls: isint **********************************************************************************/ function isreal (thestr, declen) { var dot1st = thestr.indexof('.'); var dot2nd = thestr.lastindexof('.'); var ok = true; if (isempty(thestr)) return false; if (dot1st == -1) { if (!isint(thestr)) return(false); else return(true); } else if (dot1st != dot2nd) return (false); else if (dot1st==0) return (false); else { var intpart = thestr.substring(0, dot1st); var decpart = thestr.substring(dot2nd+1); if (decpart.length > declen) return(false); else if (!isint(intpart) || !isint(decpart)) return (false); else if (isempty(decpart)) return (false); else return(true); } } /********************************************************************************* * function: isemail * parameter: string (email address) * returns: true if the string is a valid email address * false if the passed string is not a valid email address * email format: anyname@emailserver e.g; webmaster@hotmail.com * @ sign can appear only once in the email address. *********************************************************************************/ function isemail (thestr) { var atindex = thestr.indexof('@'); var dotindex = thestr.indexof('.', atindex); var flag = true; thesub = thestr.substring(0, dotindex+1) if ((atindex < 1)||(atindex != thestr.lastindexof('@'))||(dotindex < atindex + 2)||(thestr.length <= thesub.length)) { return(false); } else { return(true); } } /********************************************************************************* * function: newwindow * parameters: doc -> document to open in the new window hite -> height of the new window wide -> width of the new window bars -> 1-scroll bars = yes 0-scroll bars = no resize -> 1-resizable = yes 0-resizable = no * calls: none * returns: new window instance **********************************************************************************/ function newwindow (doc, hite, wide, bars, resize) { var winnew="_blank"; var opt="toolbar=0,location=0,directories=0,status=0,menubar=0,"; opt+=("scrollbars="+bars+","); opt+=("resizable="+resize+","); opt+=("width="+wide+","); opt+=("height="+hite); winhandle=window.open(doc,winnew,opt); return; } /********************************************************************************* * function: decimalformat * parameters: paramvalue -> field value * calls: none * returns: formated string **********************************************************************************/ function decimalformat (paramvalue) { var intpart = parseint(paramvalue); var decpart =parsefloat(paramvalue) - intpart; str = ""; if ((decpart == 0) || (decpart == null)) str += (intpart + ".00"); else str += (intpart + decpart); return (str); }
"^\\d+$" //非负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$" //正整数
"^((-\\d+)|(0+))$" //非正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$" //负整数
"^-?\\d+$" //整数
"^\\d+(" //非负浮点数(正浮点数 + 0)
"^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数
"^((-\\d+(" //非正浮点数(负浮点数 + 0)
"^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数
"^(-?\\d+)(" //浮点数
"^[a-za-z]+$" //由26个英文字母组成的字符串
"^[a-z]+$" //由26个英文字母的大写组成的字符串
"^[a-z]+$" //由26个英文字母的小写组成的字符串
"^[a-za-z0-9]+$" //由数字和26个英文字母组成的字符串
"^\\w+$" //由数字、26个英文字母或者下划线组成的字符串
"^[\\w-]+(" //email地址
"^[a-za-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\s*)?$" //url
以上是本文的全部内容,希望大家喜欢。
上一篇: Java正则表达式基础入门知识
下一篇: Python正则表达式操作指南