Java处理字符串-删除所有标点

文章目录

1	str = str.replaceAll("[\\pP‘’“”]", "");

在这里利用的是Unicode编码，Unicode 编码并不只是为某个字符简单定义了一个编码，而且还将其进行了归类。

\pP 其中的小写 p 是 property 的意思，表示 Unicode 属性，用于 Unicode 正表达式的前缀。

大写 P 表示 Unicode 字符集七个字符属性之一：标点字符。其他六个包括：

Java 中用于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准（可以找到所有的子属性）
这个文本文档一行是一个字符，第一列是 Unicode 编码，第二列是字符名，第三列是 Unicode 属性，以及其他一些字符信息。

1
2
3

String str = ",.!，，D_NAME。！；‘’”“《》**dfs  #$%^&()-+1431221中国123漢字かどうかのjavaを決定";  
str = str.replaceAll("[\\pP‘’“”]", "");  
System.out.println(str);

输出结果: DNAMEdfs $^+1431221中国123漢字かどうかのjavaを決定

AlexYoung's blog