RegularExpressions
用途
字符串匹配 字符串查找 字符串替换类
java.lang.String java.util.regex.Pattern java.util.regex.Matcher
1. 初步认识 . * + ?
. 表匹配一个字符
* 零到多个字符
+ 一到多个
? 一个或零个
2. 范围
[abc]
[^abc]
[a-zA-Z]
[a-z] | [A-Z] 或 [a-z[A-Z]]
[A-Z && [RFG]] 交集
\d [0-9]
\D [^0-9]
\s [\t\n\f\r]
\S [^\s]
\w [a-zA-Z_0-9]
e.g: "abc888&^%".matches("[a-z](1,3)\\d+[&^#%]");
3. POSIX style
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z] \p{ASCII} 所有 ASCII:[\x00-\x7F] \p{Alpha} 字母字符:[\p{Lower}\p{Upper}] \p{Digit} 十进制数字:[0-9] \p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}] \p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ \p{Graph} 可见字符:[\p{Alnum}\p{Punct}] \p{Print} 可打印字符:[\p{Graph}\x20] \p{Blank} 空格或制表符:[ \t] \p{Cntrl} 控制字符:[\x00-\x1F\x7F] \p{XDigit} 十六进制数字:[0-9a-fA-F] \p{Space} 空白字符:[ \t\n\x0B\f\r]
4. 边界匹配
^ 行的开头
$ 行的结尾 \b 单词边界 \B 非单词边界 \A 输入的开头 \G 上一个匹配的结尾 \Z 输入的结尾,仅用于最后的结束符(如果有的话) \z 输入的结尾e.g:
匹配空行 "^[\\s&&[^\\n]]*\\n$"
Email: "\\w[.-]+@[\\w[.-]]+\\.[\\w]+"
5. 匹配查找
Pattern p = Pattern.ciompile("\\d(3,5)");
String s = "123-45433-344-00"; Matcher m = p.matcher(s); m.matches(); // false 匹配整个字符串 m.reset(); m.find(); // true 依次往后查找字符串 [m.start() m.end() 匹配字串的起始位置 ] m.find(); // true m.find(); // true m.find(); // false [m.start() 未匹配的抛异常]m.lookingAt() // true 每次都从开始匹配
m.lookingAt() // true
6. 替换
Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE); // 匹配大小写不区分
Matcher m = p.matcher("java Java JAvA IloveJaVA you hateJava"); // m.replaceAll("JAVA");// 将匹配到的单数个java替换为大写,双数替换为小写
StringBuffer buf = new StringBuffer(); int i = 0; while(m.find()) { i++; if(i%2 ==0) m.appendReplacement(buf, "java"); else m.appendReplacement(buf, "JAVA"); } m.appendTail(buf);
7. 分组
Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})"); // 小括号 分组
String s = "123aa-34345bb-234cc-00"; Matcher m = p.matcher(s); while(m.find()) { m.group(); m.group(1); m.group(2); }
8. 数量词
Greedy 贪婪 默认 Reluctant 勉强的,不情愿的 ? Possessive 独占 +e.g :
// Pattern p = Pattern.compile("(.{3,10})[0-9]");
// Pattern p = Pattern.compile("(.{3,10}?)[0-9]"); Pattern p = Pattern.compile("(.{3,10}+)[0-9]"); String s = "aaaa5bbbb6"; Matcher m = p.matcher(s); if(m.find()) p(m.start() + "-" + m.end()); else p("not match");9. 向前引用
e.g:
Pattern p = Pattern.compile("(\\d(\\d))\\2"); // 2 为组号 String s = "122"; Matcher m = p.matcher(s); m.matches(); // true10. flags 的简写
Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE);
"jAVA".matches("(?i)(java)");