随着社交媒体的迅猛发展,我们越来越感觉到被纷繁的信息所累,诈骗、传销、暴恐、色情、邪教胁迫、网络赌博、反伦理、假发票、语言暴力、垃圾广告等不良信息无孔不入,呼啸而来,我们深陷其中,甚至被裹挟吞噬。在这场信息与噪音的对抗中,我们如何冲出迷障,把握主动权?
面对如此海量的信息流,传统信息过滤技术只能通过简单的关键词匹配,错漏百出,准确率极低,发挥的作用只能是杯水车薪。北理工大数据搜索与挖掘实验室结合多年的实战经验,利用多项自然语言处理专利算法,推出了九眼智能过滤系统,为信息的智能实时过滤提供了全新的技术解决方案!
九眼智能过滤系统简介
九眼智能过滤系统面向复杂文本大数据的内容智能过滤系统,可实时智能识别关键词音变、形变与拆字等常见变体,并实现了语义的精准排歧,系统内置了国内最新最全的知识库,适用于诈骗、传销、暴恐、色情、邪教胁迫、网络赌博、反伦理、假发票、语言暴力、垃圾广告等不良内容的智能过滤发现。
单机测试界面如下:
系统技术架构:
九眼智能过滤三大技术核心:智能变种、语义排歧、快速实时
1、智能变种识别
九眼智能过滤利用美双数组TRIE树词典管理与检索方法,系统自动识别形变词、音变词、拆字、噪音、繁简体、全角半角、中间加各类干扰噪音等变体; 如“發嘌”、“Fa票”转换为同音词“卖发票”,将拆字“弓长”转换为“张”,“六人一口cai”识别为“六合彩”。同时,系统支持自定义不良词库,增量添加百万量级词库。
2、语义排歧
九眼智能过滤利用NLPIR语义精准分词系统与情感分析系统,精准识别与过滤,排除正面无害的信息,极大降低了误判率。语义排歧示例:“一次[性交]费5000元”、“我[家宝]贝”、“[插入]银行卡”,买了一袋漂[白粉]。
3、快速实时
九眼智能过滤使用专利算法,快速扫描,单机速度30MB/s;支持单机多线程、多机并行、Hadoop云服务模式,对PB级信息内容实现并行高效在线核查。
九眼智能过滤特色与优势
九眼智能过滤系统充分融合了自然语言理解、人工智能、大数据分析等领域尖端技术,具有智能化、语义化、实时性三大特点,其优势无可比拟:
九眼智能过滤:沙里淘金,数中寻宝
信息安全关乎每个人,我们提倡数据共享,但我们更警惕信息安全!秉持着高度的社会责任感,我们致力于营造一个绿色健康的信息共享空间。我们相信:唯有真,可期待!
九眼智能过滤系统开创信息过滤新技术,将自然语言和人工智能紧密结合,打破传统技术局限,变被动为主动,实现了信息过滤的智能化、语义化、快速化,探索出了信息过滤的新可能。
九眼智能过滤,管他千变万化!欢迎访问: http://9Eye.nlpir.cn/ 使用。