欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Java—split函数

程序员文章站 2022-07-14 12:02:10
...

Java中的 split  函数是用于按指定字符(串)或正则去分割某个字符串,结果以字符串数组形式返回;

  下面是到例题, 这道题目是想我们去掉字符串s中多余的空格和标点符号;

String s = "cat dog,desk push last,   this is what.   must be";

String[] ss = s.split("\\s*\\,\\s*|\\s*\\.\\s*|\\s+");   //填空位置

//String[] string = s.split("\\s*\\p{Punct}\\s*|\\p{Space}+");   //第二种

for(String k: string) System.out.println(k);

第一种是找出s中存在的标点符号;而第二种是直接用正则表达式;

以下是代码的结果:

cat
dog
desk
push
last
this
is
what
must
be

 

  

java中提供了对正则表达式的支持,以下是一些正则表达式;

字符类
[abc] a、b 或 c(简单类)
[^abc] 任何字符,除了 a、b 或 c(否定)
[a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集)
[a-z&&[def]] d、e 或 f(交集)
[a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去)
[a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去)
   
预定义字符类
\d 数字:[0-9]
\D 非数字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
   
POSIX 字符类(仅 US-ASCII)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>[email protected][\]^_`{|}~
   

 

相关标签: split