欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

PHP学习:字符串操作和正则表达式

程序员文章站 2022-06-09 14:28:58
...
主要内容:
  1. 字符串格式化;
  2. 用字符串函数连接和分隔字符串;
  3. 字符串比较;
  4. 使用字符串函数匹配和替换子字符串;
  5. 使用正则表达式;

字符串格式化

1,去空格:trim(),ltrim(),rtrim()

trim()函数去掉头尾两边的空格。

ltrim()函数去掉开始的空格。

rtrim()函数去掉结尾的空格。

2,格式化字符串:printf(),sprintf()

printf()函数和sprintf()函数,和echo的功能相同,都会打印字符串。但是它们可以实现更复杂的格式(象C#中string.Format()类似)。

printf()和sprintf()原型如下:

string sprintf(string format[,mixed args..]);
void printf(string format[,mixed args...]);

sprintf()返回格式化后的字符串。而printf直接将结果输出。它们两个的功能类似,所以就已printf()为例。

$boy = "boy";
echo "i am a $boy";
echo '
'; printf("i am a %s",$boy);

上面输出的结果一样。

其中format中的类型可以有以下几种:

PHP学习:字符串操作和正则表达式

format中的所有转换类型都以%开始。如果想打印一个“%”符号,必须使用两个“%%”

3,改变字符串中的字符大小写

a).将字符转换为大写:strtoupper()

$str = "i am a boy";
echo strtoupper($str);

b).将字符转换为小写 :strtolower()

$str = "I Am A Boy";
echo strtolower($str);

c).如果第一个字符是字母,就转换成大写:ucfirst()

$str = "i am a boy";
echo ucfirst($str);

d).将字符串中每个单词的第一个字母转成大写:ucwords()

$str = "i am a boy";
echo ucwords($str);

4,转义字符串

addslashes()函数就是把“转换成\”,或者把\转成双斜杠\\等等之类的操作。

$str = '"i am a [\] boy."';
echo addslashes($str);

输出:\"i am a [\\] boy.\"

addslashes()函数相反的函数就是stripslashes()。

5,编码字符串

htmlspecialchars()函数把&,,“等等,编码成浏览器不能解释的字符。

用字符串函数连接和分隔字符串

1,分隔字符串:explode()

它的原型如下:

array explode(string separator,string input[,int limit]);

可以看出返回数组。使用如下:

$str = "1,2,3,4,5";
$arr = explode(',',$str);
foreach($arr as $v){
	echo $v.'
'; }

返回1 2 3 4 5

既然有分隔就会有整合。不错,implode()和join()函数实现就是和explode()相反的操作。

$str = "1,2,3,4,5";
$arr = explode(',',$str);
echo implode(',',$arr);

2,截取字符串:substr()

substr()函数的原型如下:

string substr(string input,int start[,int length]);

第二个参数表示截取的开始位置。

第三个参数表示截取的长度。

使用如下:

$str = "i am a boy";
echo substr($str,2);

输出:am a boy

需要注意的是,第二个参数和第三个参数可以为负,如果为负,就意味着从后边开始。

function reverse_i($str){
		for($i=1;$i

返回:drow;

字符串比较

1,字符串排序:strcmp(),strcasecmp(),strnatcmp()

strcmp()的原型如下:

int strcmp(string str1,string str2);

如果两个字符串相等,返回0;如果按字典顺序str1在str2后面就返回一个正数,反之。这个函数是区分大小写的。

$str1 = "2";
$str2 = "12";
echo strcmp($str1,$str2);

返回1,说明它是按字典顺序排列的,$str1的第一个字符大于$str2的第一个字符。

strcasecmp()函数除了不区分大小写之外,其他和strcmp()函数一样。

而strnatcmp()则是按照人们习惯的顺序进行排序。它也不区分大小写。

$str1 = "2";
$str2 = "12";
echo strnatcmp($str1,$str2);

返回-1,说明12比2大。

2,获得字符串的长度:strlen()

strlen(“hello”),输出结果为5。

使用字符串函数匹配和替换子字符串

1,在字符串中查找字符串:strstr(),strchr(),strrchr()和strissr()

这些函数看起来张得差不多,真是难记啊!~~

最常用的是strstr()函数,strchr()函数和strstr()函数时一样的,虽然感觉strchr()是查找一个字符的意思。

strstr()函数的原型如下:

string strstr(string haystack,string needle);
第一个参数为整个字符串。

第二个参数为需要查找的子字符串。

如果找到一个匹配,函数会从needle前面返回haystack,否则返回false。如果存在不止一个needle,返回的字符串从出现第一个needle的位置开始。

a).一个精确匹配

$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";
echo strstr($str1,'very');

输出:very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.

b).多个匹配

$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward";
echo strstr($str1,'been');

输出:been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.

函数strstr()有两个变体。第一个是stristr()函数,它几乎和strstr()函数一样,但区别就是不区分大小写。

第二个是strrchr()函数,它几乎和strstr()一样,但会从最后出现needle的位置的前面返回字符串haystack。

此函数第二个参数为字符。

$str1 = "To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";
echo strrchr($str1,'w');
输出:ward.

2,查找字符串的位置:strpos(),strrpos()

strpos()函数和strstr()函数的操作类似。但它不是返回一个字符串,而是返回子字符串在整个字符串中的位置。我们平常使用的也是这个。而且比strstr()速度也快。

strpos()函数原型如下:

int strpos(string haystack,string needle,int offset);

第三个参数是可选的,标示开始搜索的位置。

$str1 = "hello word";
echo strpos($str1,'o');

输出:4,位置是从0开始起。也可以用子字符串,这里只是出于演示目的。

$str1 = "hello word";
echo strpos($str1,'o',5);

输出:7。是从位置5开始搜索,也就看不到位置4的那个“o”了。

函数strrpos()也几乎一样,但返回的是子字符串在整个字符串中最后一次出现的位置。

$str1 = "hello word";
echo strrpos($str1,'o');

输出:7。说明“o”在hello word中最后一个位置的7。

这里需要注意一下,PHP中的false等于0,如果strpos()或者strrpos()都返回false(没有找到)或者在第一个字符就找到了(第一个字符的起始位置是0),

那么就区分不出来是找到,还是未找到了。那怎么办呢?只能用“===”恒等式来避免这个问题了。

$str1 = "hello word";
$position = strrpos($str1,'h'); //第一个字符就找到了,$position ==0
if($position === false){
	echo '没有找到';
}else{
	echo $position;
}

3,替换子字符串:str_replace(),substr_replace()

str_replace()函数的原型如下:

mixed str_replace(mixed needle,mixed new_needle,mixed haystack[,int &count]);

第三个参数是可选的。它包含了要执行的替换操作次数。

返回替换过的字符串。

$str1 = "hello word";
echo str_replace('word','china',$str1);

输出:hello china

函数substr_replace()则用来在给定位置中查找和替换字符串中特定的子字符串。原型如下:

string substr_replace(string string,string replacement,int start[,int length]);

这个函数使用字符串replacement替换整个字符串string中的一部分。具体是那一部分则取决于起始位置和可选参数length的值。

需要注意的是,start的值如果是0或者一个正值,就是从字符串开始计算偏移量;如果是一个负值,就从字符串末尾开始的一个偏移量。

使用正则表达式

1,查找子字符串:ereg(),eregi()

ereg()函数的原型如下:

int ereg(string pattern,string search,array [matches]);

在search字符串中查找正则为pattern的表达式,如果发现了与pattern的字表达式相匹配的字符串,这些字符串将会存储在数组matches中,每个数组元素对应一个子表达式。

函数eregi()函数除了不区分大小写外,其功能与ereg()一样。

$str1 = "xxx@gmail.com.cn";
if(!eregi('[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}',$str1)){
	echo '不是正确的Email';
}else{
	echo '正确';
}

2,替换子字符串:ereg_replace(),eregi_replace()

于str_replace()函数一样,只不过这两个使用正则表达式当做参数。

ereg_replace()的原型如下:

string ereg_replace(string pattern,string replacement,string search);
$str1 = "123123@gmail.com.cn";
echo ereg_replace('[A-Z0-9._%+-]+@','**@',$str1);

输出:**@gmail.com.cn

函数eregi_replace除了不区分大小写外,其他与ereg_replace()相同。

3,分隔字符串:split()

函数split()的原型如下:

array split(string pattern,string search[,int max]);

第三个参数为可选,表示进入数组中的元素个数。

返回值是数组。

$str1 = "123123@gmail.com.cn";
$arr = split('\.|@',$str1);
while(list($key,$value) = each($arr)){
	echo '
'.$key.'--'.$value; }

输出:

0--123123
1--gmail
2--com
3--cn

split()函数和explode()函数有点相似,前者是用正则表达式当做分隔符,后者是用字符串当做分隔符。

参考:PHP与MySQL.WEB开发