白名单屏蔽字 unicode字符范围
程序员文章站
2022-07-05 14:49:09
...
(_word.unicode >= 0x2001 && _word.unicode <= 0x206F) ||//常用标点(General Punctuation)http://www.unicode.org/charts/PDF/U2000.pdf
(_word.unicode >= 0x3001 && _word.unicode <= 0x303F) ||//CJK 符号和标点 奇怪符号 http://www.unicode.org/charts/PDF/U3000.pdf
(_word.unicode >= 0xFF01 && _word.unicode <= 0xFF65) ||//运算符数字大小写字母http://www.unicode.org/charts/PDF/UFF00.pdf
(_word.unicode >= 0x4E00 && _word.unicode <= 0x9FA5))//所有中文
)
参考http://www.cnblogs.com/sosoft/p/3456631.html
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/uff00.html
生僻字查询
http://zhaopin.haedu.cn/spz.html
繁体字网名
http://www.aies.cn/
上一篇: 读取文本
下一篇: 【ElasticSearch】高亮搜索