欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

正则表达式基本语法详解

程序员文章站 2022-11-05 19:24:44
正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。 1.正则表达式基本语法...

正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。

1.正则表达式基本语法

两个特殊的符号'^'和'$'。他们的作用是分别指出一个字符串的开始和结束。例子如下:

"^the":表示所有以"the"开始的字符串("there","the cat"等);
"of despair$":表示所以以"of despair"结尾的字符串;
"^abc$":表示开始和结尾都是"abc"的字符串——呵呵,只有"abc"自己了;
"notice":表示任何包含"notice"的字符串。

象最后那个例子,如果你不使用两个特殊字符,你就在表示要查找的串在被查找串的任意部分——你并
不把它定位在某一个顶端。

其它还有'*','+'和'?'这三个符号,表示一个或一序列字符重复出现的次数。它们分别表示“没有或
更多”,“一次或更多”还有“没有或一次”。下面是几个例子:

"ab*":表示一个字符串有一个a后面跟着零个或若干个b。("a", "ab", "abbb",……);
"ab+":表示一个字符串有一个a后面跟着至少一个b或者更多;
"ab?":表示一个字符串有一个a后面跟着零个或者一个b;
"a?b+$":表示在字符串的末尾有零个或一个a跟着一个或几个b。

你也可以使用范围,用大括号括起,用以表示重复次数的范围。

"ab{2}":表示一个字符串有一个a跟着2个b("abb");
"ab{2,}":表示一个字符串有一个a跟着至少2个b;
"ab{3,5}":表示一个字符串有一个a跟着3到5个b。

请注意,你必须指定范围的下限(如:"{0,2}"而不是"{,2}")。还有,你可能注意到了,'*','+'和
'?'相当于"{0,}","{1,}"和"{0,1}"。
还有一个'¦',表示“或”操作:

"hi¦hello":表示一个字符串里有"hi"或者"hello";
"(b¦cd)ef":表示"bef"或"cdef";
"(a¦b)*c":表示一串"a""b"混合的字符串后面跟一个"c";

'.'可以替代任何字符:

"a.[0-9]":表示一个字符串有一个"a"后面跟着一个任意字符和一个数字;
"^.{3}$":表示有任意三个字符的字符串(长度为3个字符);

方括号表示某些字符允许在一个字符串中的某一特定位置出现:

"[ab]":表示一个字符串有一个"a"或"b"(相当于"a¦b");
"[a-d]":表示一个字符串包含小写的'a'到'd'中的一个(相当于"a¦b¦c¦d"或者"[abcd]");
"^[a-za-z]":表示一个以字母开头的字符串;
"[0-9]%":表示一个百分号前有一位的数字;
",[a-za-z0-9]$":表示一个字符串以一个逗号后面跟着一个字母或数字结束。

你也可以在方括号里用'^'表示不希望出现的字符,'^'应在方括号里的第一位。(如:"%[^a-za-z]%"表
示两个百分号中不应该出现字母)。

为了逐字表达,你必须在"^.$()¦*+?{\"这些字符前加上转移字符'\'。

请注意在方括号中,不需要转义字符。

2.正则表达式验证控制文本框的输入字符类型

1.只能输入数字和英文的:

<input onkeyup="value=value.replace(/[\w]/g,'') " onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\d]/g,''))" id="text1" name="text1">

2.只能输入数字的:

<input onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\d]/g,''))" id="text2" name="text2">

3.只能输入全角的:

<input onkeyup="value=value.replace(/[^\uff00-\uffff]/g,'')" onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\uff00-\uffff]/g,''))" id="text3" name="text3">

4.只能输入汉字的:

<input onkeyup="value=value.replace(/[^\u4e00-\u9fa5]/g,'')" onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^\u4e00-\u9fa5]/g,''))" id="text4" name="text4">

3.正则表达式的应用实例通俗说明

*******************************************************************************

//校验是否全由数字组成

/^[0-9]{1,20}$/

^ 表示打头的字符要匹配紧跟^后面的规则

$ 表示打头的字符要匹配紧靠$前面的规则

[ ] 中的内容是可选字符集

[0-9] 表示要求字符范围在0-9之间

{1,20}表示数字字符串长度合法为1到20,即为[0-9]中的字符出现次数的范围是1到20次。
/^ 和 $/成对使用应该是表示要求整个字符串完全匹配定义的规则,而不是只匹配字符串中的一个子串。
*******************************************************************************

//校验登录名:只能输入5-20个以字母开头、可带数字、“_”、“.”的字串

/^[a-za-z]{1}([a-za-z0-9]|[._]){4,19}$/

^[a-za-z]{1} 表示第一个字符要求是字母。

([a-za-z0-9]|[._]){4,19} 表示从第二位开始(因为它紧跟在上个表达式后面)的一个长度为4到9位的字符串,它要求是由大小写字母、数字或者特殊字符集[._]组成。

*******************************************************************************

//校验用户姓名:只能输入1-30个以字母开头的字串

/^[a-za-z]{1,30}$/

*******************************************************************************

//校验密码:只能输入6-20个字母、数字、下划线

/^(\w){6,20}$/

\w:用于匹配字母,数字或下划线字符

*******************************************************************************

//校验普通电话、传真号码:可以“+”或数字开头,可含有“-” 和 “ ”

/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/

\d:用于匹配从0到9的数字;

“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次

可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等

*******************************************************************************

//校验url

/^http[s]{0,1}:\/\/.+$/ 或 /^http[s]{0,1}:\/\/.{1,n}$/ (表示url串的长度为length(“https://”) + n )

\ / :表示字符“/”。

. 表示所有字符的集

+ 等同于{1,},就是1到正无穷吧。

*******************************************************************************

//校验纯中文字符
/^[\u4e00-\u9fa5]+$/
[\u4e00-\u9fa5] :估计是中文字符集的范围吧
以上表达式均在下面的javascript中测试通过
<html>
<script language="javascript">
<!--
function regx(r,s)
{
    if (r == null || r == ""){
       return false;
    }
    var patrn= new regexp(r);
    if (patrn.exec(s))
       return true
    return false
}
-->
</script>
<body>
<form>
    规则表达式 : <input type="input" name="regxstr" value="" > (填写/ /之间的表达式)
<br>
    校验字符串 : <input type="input" name="str" value="" >
    <input type="button" name="match" value="匹配" onclick="alert(regx(regxstr.value,str.value));">
</form>
</body>
</html>

4.正則表達式應用

"^\d+$"  //非负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$"  //正整数
"^((-\d+)|(0+))$"  //非正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$"  //负整数
"^-?\d+$"    //整数
"^\d+(\.\d+)?$"  //非负浮点数(正浮点数 + 0)
"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数
"^((-\d+(\.\d+)?)|(0+(\.0+)?))$"  //非正浮点数(负浮点数 + 0)
"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数
"^(-?\d+)(\.\d+)?$"  //浮点数
"^[a-za-z]+$"  //由26个英文字母组成的字符串
"^[a-z]+$"  //由26个英文字母的大写组成的字符串
"^[a-z]+$"  //由26个英文字母的小写组成的字符串
"^[a-za-z0-9]+$"  //由数字和26个英文字母组成的字符串
"^\w+$"  //由数字、26个英文字母或者下划线组成的字符串
"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"    //email地址
"^[a-za-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$"  //url
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/   //  年-月-日
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/   // 月/日/年
"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-za-z]{2,4}|[0-9]{1,3})(]?)$"   //emil
"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?"     //电话号码
"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$"   //ip地址

^([0-9a-f]{2})(-[0-9a-f]{2}){5}$   //mac地址的正则表达式
^[-+]?\d+(\.\d+)?$  //值类型正则表达式

5.javascript正则表达式检验

//校验是否全由数字组成
function isdigit(s)
{
var patrn=/^[0-9]{1,20}$/;
if (!patrn.exec(s)) return false
return true
}
//校验登录名:只能输入5-20个以字母开头、可带数字、“_”、“.”的字串
function isregisterusername(s)
{
var patrn=/^[a-za-z]{1}([a-za-z0-9]|[._]){4,19}$/;
if (!patrn.exec(s)) return false
return true
}
//校验用户姓名:只能输入1-30个以字母开头的字串
function istruename(s)
{
var patrn=/^[a-za-z]{1,30}$/;
if (!patrn.exec(s)) return false
return true
}
//校验密码:只能输入6-20个字母、数字、下划线
function ispasswd(s)
{
var patrn=/^(\w){6,20}$/;
if (!patrn.exec(s)) return false
return true
}
//校验普通电话、传真号码:可以“+”开头,除数字外,可含有“-”
function istel(s)
{
//var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?(\d){1,12})+$/;
var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
if (!patrn.exec(s)) return false
return true
}
//校验手机号码:必须以数字开头,除数字外,可含有“-”
function ismobil(s)
{
var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
if (!patrn.exec(s)) return false
return true
}
//校验邮政编码
function ispostalcode(s)
{
//var patrn=/^[a-za-z0-9]{3,12}$/;
var patrn=/^[a-za-z0-9 ]{3,12}$/;
if (!patrn.exec(s)) return false
return true
}
//校验搜索关键字
function issearch(s)
{
var patrn=/^[^`~!@#$%^&*()+=|\\\][\]\{\}:;\'\,.<>/?]{1}[^`~!@$%^&()+=|\\\][\]\{\}:;\'\,.<>?]{0,19}$/;
if (!patrn.exec(s)) return false
return true
}
function isip(s) //by zergling
{
var patrn=/^[0-9.]{1,20}$/;
if (!patrn.exec(s)) return false
return true
}
/*********************************************************************************
* function: isbetween
* parameters: val as any value
* lo as lower limit to check
* hi as higher limit to check
* calls: nothing
* returns: true if val is between lo and hi both inclusive, otherwise false.
**********************************************************************************/
function isbetween (val, lo, hi) {
if ((val < lo) || (val > hi)) { return(false); }
else { return(true); }
}
/*********************************************************************************
* function: isdate checks a valid date
* parameters: thestr as string
* calls: isbetween, isint
* returns: true if thestr is a valid date otherwise false.
**********************************************************************************/
function isdate (thestr) {
var the1st = thestr.indexof('-');
var the2nd = thestr.lastindexof('-');
if (the1st == the2nd) { return(false); }
else {
var y = thestr.substring(0,the1st);
var m = thestr.substring(the1st+1,the2nd);
var d = thestr.substring(the2nd+1,thestr.length);
var maxdays = 31;
if (isint(m)==false || isint(d)==false || isint(y)==false) {
return(false); }
else if (y.length < 4) { return(false); }
else if (!isbetween (m, 1, 12)) { return(false); }
else if (m==4 || m==6 || m==9 || m==11) maxdays = 30;
else if (m==2) {
if (y % 4 > 0) maxdays = 28;
else if (y % 100 == 0 && y % 400 > 0) maxdays = 28;
else maxdays = 29;
}
if (isbetween(d, 1, maxdays) == false) { return(false); }
else { return(true); }
}
}
/*********************************************************************************
* function: iseudate checks a valid date in british format
* parameters: thestr as string
* calls: isbetween, isint
* returns: true if thestr is a valid date otherwise false.
**********************************************************************************/
function iseudate (thestr) {
if (isbetween(thestr.length, 8, 10) == false) { return(false); }
else {
var the1st = thestr.indexof('/');
var the2nd = thestr.lastindexof('/');
if (the1st == the2nd) { return(false); }
else {
var m = thestr.substring(the1st+1,the2nd);
var d = thestr.substring(0,the1st);
var y = thestr.substring(the2nd+1,thestr.length);
var maxdays = 31;
if (isint(m)==false || isint(d)==false || isint(y)==false) {
return(false); }
else if (y.length < 4) { return(false); }
else if (isbetween (m, 1, 12) == false) { return(false); }
else if (m==4 || m==6 || m==9 || m==11) maxdays = 30;
else if (m==2) {
if (y % 4 > 0) maxdays = 28;
else if (y % 100 == 0 && y % 400 > 0) maxdays = 28;
else maxdays = 29;
}
if (isbetween(d, 1, maxdays) == false) { return(false); }
else { return(true); }
}
}
}
/********************************************************************************
* function: compare date! which is the latest!
* parameters: lessdate,moredate as string
* calls: isdate,isbetween
* returns: true if lessdate<moredate
*********************************************************************************/
function iscomdate (lessdate , moredate)
{
if (!isdate(lessdate)) { return(false);}
if (!isdate(moredate)) { return(false);}
var less1st = lessdate.indexof('-');
var less2nd = lessdate.lastindexof('-');
var more1st = moredate.indexof('-');
var more2nd = moredate.lastindexof('-');
var lessy = lessdate.substring(0,less1st);
var lessm = lessdate.substring(less1st+1,less2nd);
var lessd = lessdate.substring(less2nd+1,lessdate.length);
var morey = moredate.substring(0,more1st);
var morem = moredate.substring(more1st+1,more2nd);
var mored = moredate.substring(more2nd+1,moredate.length);
var date1 = new date(lessy,lessm,lessd); 
var date2 = new date(morey,morem,mored); 
if (date1>date2) { return(false);}
return(true);
}
/*********************************************************************************
* function isempty checks if the parameter is empty or null
* parameter str as string
**********************************************************************************/
function isempty (str) {
if ((str==null)||(str.length==0)) return true;
else return(false);
}
/*********************************************************************************
* function: isint
* parameter: thestr as string 
* returns: true if the passed parameter is an integer, otherwise false
* calls: isdigit
**********************************************************************************/
function isint (thestr) {
var flag = true;
if (isempty(thestr)) { flag=false; }
else
{ for (var i=0; i<thestr.length; i++) {
if (isdigit(thestr.substring(i,i+1)) == false) {
flag = false; break;
}
}
}
return(flag);
}
/*********************************************************************************
* function: isreal
* parameter: hestr as string 
declen as integer (how many digits after period)
* returns: true if thestr is a float, otherwise false
* calls: isint
**********************************************************************************/
function isreal (thestr, declen) {
var dot1st = thestr.indexof('.');
var dot2nd = thestr.lastindexof('.');
var ok = true;
if (isempty(thestr)) return false;
if (dot1st == -1) {
if (!isint(thestr)) return(false);
else return(true);
}
else if (dot1st != dot2nd) return (false);
else if (dot1st==0) return (false);
else {
var intpart = thestr.substring(0, dot1st);
var decpart = thestr.substring(dot2nd+1);
if (decpart.length > declen) return(false);
else if (!isint(intpart) || !isint(decpart)) return (false);
else if (isempty(decpart)) return (false);
else return(true);
}
}
/*********************************************************************************
* function: isemail
* parameter: string (email address)
* returns: true if the string is a valid email address
* false if the passed string is not a valid email address
* email format: anyname@emailserver e.g; webmaster@hotmail.com
* @ sign can appear only once in the email address.
*********************************************************************************/
function isemail (thestr) {
var atindex = thestr.indexof('@');
var dotindex = thestr.indexof('.', atindex);
var flag = true;
thesub = thestr.substring(0, dotindex+1)
if ((atindex < 1)||(atindex != thestr.lastindexof('@'))||(dotindex < atindex + 2)||(thestr.length <= thesub.length)) 
{ return(false); }
else { return(true); }
}
/*********************************************************************************
* function: newwindow
* parameters: doc -> document to open in the new window
hite -> height of the new window
wide -> width of the new window
bars -> 1-scroll bars = yes 0-scroll bars = no
resize -> 1-resizable = yes 0-resizable = no
* calls: none
* returns: new window instance
**********************************************************************************/
function newwindow (doc, hite, wide, bars, resize) {
var winnew="_blank";
var opt="toolbar=0,location=0,directories=0,status=0,menubar=0,";
opt+=("scrollbars="+bars+",");
opt+=("resizable="+resize+",");
opt+=("width="+wide+",");
opt+=("height="+hite);
winhandle=window.open(doc,winnew,opt);
return;
}
/*********************************************************************************
* function: decimalformat
* parameters: paramvalue -> field value
* calls: none
* returns: formated string
**********************************************************************************/
function decimalformat (paramvalue) {
var intpart = parseint(paramvalue);
var decpart =parsefloat(paramvalue) - intpart;
str = "";
if ((decpart == 0) || (decpart == null)) str += (intpart + ".00");
else str += (intpart + decpart);
return (str);
}

"^\\d+$"  //非负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$"  //正整数
"^((-\\d+)|(0+))$"  //非正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$"  //负整数
"^-?\\d+$"    //整数
"^\\d+("  //非负浮点数(正浮点数 + 0)
"^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数
"^((-\\d+("  //非正浮点数(负浮点数 + 0)
"^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数
"^(-?\\d+)("  //浮点数
"^[a-za-z]+$"  //由26个英文字母组成的字符串
"^[a-z]+$"  //由26个英文字母的大写组成的字符串
"^[a-z]+$"  //由26个英文字母的小写组成的字符串
"^[a-za-z0-9]+$"  //由数字和26个英文字母组成的字符串
"^\\w+$"  //由数字、26个英文字母或者下划线组成的字符串
"^[\\w-]+("    //email地址
"^[a-za-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\s*)?$"  //url

以上是本文的全部内容,希望大家喜欢。