C#敏感词过滤实现方法
程序员文章站
2022-05-15 14:22:35
本文实例讲述了c#敏感词过滤实现方法。分享给大家供大家参考。具体如下:
这两天突然想到了敏感词过滤 就结合网上找到的资料自己写了一个,脏字数量700+(效率不是很高 测试...
本文实例讲述了c#敏感词过滤实现方法。分享给大家供大家参考。具体如下:
这两天突然想到了敏感词过滤 就结合网上找到的资料自己写了一个,脏字数量700+(效率不是很高 测试在110多kb的情况下比replace快 3-4倍)
测试结果图 单位:秒
代码如下:
system.text.stringbuilder sb = new system.text.stringbuilder(text.length); string filtertext = "需要过滤的脏字 以|分开"; //脏字 可根据自己的方式用分隔符 string[] filterdata = filtertext.split('|'); foreach (var item in filterdata) { char value = item[0]; if (diclist.containskey(value)) diclist[value].add(item); else diclist.add(value, new list<string>() { item }); } int count = text.length; for (int i = 0; i < count; i++) { char word = text[i]; if (diclist.containskey(word))//如果在字典表中存在这个key { int num = 0;//是否找到匹配的关键字 1找到0未找到 var data = diclist[word].orderby(g => g.length); //把该key的字典集合按 字符数排序(方便下面从少往多截取字符串查找) foreach (var wordbook in data) { if (i + wordbook.length <= count) //如果需截取的字符串的索引小于总长度 则执行截取 { string result = text.substring(i, wordbook.length); //根据关键字长度往后截取相同的字符数进行比较 if (result == wordbook) { num = 1; sb.append(getstring(result)); i = i + wordbook.length - 1; //比较成功 同时改变i的索引 break; } } } if (num == 0) sb.append(word); } else sb.append(word); } return sb.tostring(); } /// <summary> /// 替换星号 /// </summary> /// <param name="value"></param> /// <returns></returns> private static string getstring(string value) { string starnum = string.empty; for (int i = 0; i < value.length; i++) { starnum += "*"; } return starnum; }
还有待优化的地方
各位有更好的方法还请分享指点一下,说明原理
希望本文所述对大家的c#程序设计有所帮助。
上一篇: Web前端——JavaScript练习
下一篇: DDL、DML、TCL