欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

如何用正则替换敏感词?敏感词过滤?

程序员文章站 2022-04-25 12:25:55
...
评论区敏感词替换,如果在评论中发现敏感词存入数据库之前,进行替换敏感词,用正则的话该如何做?假如如果想替换“鸡蛋”这个词,但文章中有“臭鸡蛋”这个词,如何保证鸡蛋被替换而臭鸡蛋不被替换?

回复内容:

评论区敏感词替换,如果在评论中发现敏感词存入数据库之前,进行替换敏感词,用正则的话该如何做?假如如果想替换“鸡蛋”这个词,但文章中有“臭鸡蛋”这个词,如何保证鸡蛋被替换而臭鸡蛋不被替换?

感谢邀请。
如果是我的话只会进行检查,然后给出敏感词提示,不会直接进行替换的。首先,我个人不喜欢这个事情,因为替换后肯定词不达意,而且这种检查作用比想象的小的多的多,有心人会避开检查机制,甚至不使用敏感词一样可以表达不好的言论,所以治标不治本。其次,本来正常的内容因此变得难以阅读。
必要的话你可以搜索这方面的插件,应该是一个很简单的类或者函数外带一个词库数据,逻辑上没什么讨论价值。因为你举得例子就不恰当,如果“鸡蛋”是敏感词,臭“鸡蛋”一样是被网监监控的,而不是你想象的情况,所以实际上根本没必要考虑分词问题。

最好有个敏感词库 去库里面匹配就行了

这个不现实...

那就用多音字 或者 繁体字,或者拼音