欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

Nlpir Parser敏感信息过滤系统实例详解

程序员文章站 2022-03-05 13:37:54
...
  互联网是当今最大的信息资源库之一,其信息发布的及时性与全球互联性使得其对整个社会的发展起着巨大的影响。由于互联网相关技术飞速发展,它已经影响到了日常生活的方方面面,对整个社会起着革命性的影响。网络在为人们提供各种前所未有的便利的同时,也为有害信息的广泛传播提供了便捷。这些信息特别是敏感信息对社会尤其是未成年人的影响日益引起人们的极大关注。如何净化网络环境,有效识别并过滤有害信息成了当前迫切需要解决的问题。

  常见的方法是基于中文信息处理技术和多模式匹配技术,结合机器学习方法训练得到的词表,能够有效地识别敏感词,进而识别有害文字。敏感词识别要求能够处理“拆字”、“同音字”、“拼音字”、“缩略词”等几种模式和模式的组合。敏感词识别技术帮助用户摆脱有害信息的侵扰,进一步杜绝各种不文明信息内容的出现,可对各类有害信息及时有效地发起预警,并严防此类严重错误见诸报端。

  灵玖软件Nlpir Parser敏感信息过滤系统是针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,可以导入大批量用户业务敏感的关键词列表,实现对内存与文件的实时智能扫描,生成命中的敏感关键词、敏感类别与权重等信息。

  灵玖软件Nlpir Parser敏感信息过滤系统应用

  1、敏感内容信息过滤

  可以设定敏感关键词,针对文章内容、信息关键词进行扫描,可以对敏感信息、事件、人物等信息进行剔除或抓取,适用于网站、出版、上网行为管理。通过针对特定关键词设定,可以过滤大量垃圾信息,净化互联网环境,适用于信息网站、各种论坛的信息整理。

  2、敏感账号扫描

  通过设定一个或一组敏感账号进行扫描,可以跟踪相关账号的传播路径、权重、受众群体及社会反响等互联网信息,适用于产品、人物跟踪。

  3、特定情报实时发现

  可以快速便捷地匹配大量自定义的业务关键词,智能发现不良信息的内容,达到净化网络空间、提取情报的目的,确保国家、社会与个人的信息内容安全。

Nlpir Parser敏感信息过滤系统包括敏感词检测子系统、人工干预操作子系统、敏感信息替换子系统以及敏感词判定分值效果回馈子系统组成,其特征在于所述敏感词检测子系统,它实现对包含敏感数据的检查,即在一定时间间隔内对原始数据建立索引,再通过对已建立索引的检查,分离出包含敏感信息的数据。

以上就是Nlpir Parser敏感信息过滤系统实例详解的详细内容,更多请关注其它相关文章!

相关标签: 大数据搜索