JZSearch精准搜索引擎由北理工副教授张华平博士精心设计,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。目前已经应用于中国邮政搜索引擎、河北省标准搜索引擎、富基融通(纳斯达克上市公司:EFUT)商品搜索以及新疆维文搜索引擎。
同时,全文搜索中间件通过可视化界面,可以快速地配置相关参数,启动搜索服务,并提供测试程序,可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。
搜索基本功能包括:
2 多字段关联搜索:非结构化与结构化字段的关联搜索,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;
2 指定字段排序:可以按照任意指定字段的排序;
2 精确搜索:支持精确匹配以及模糊匹配,默认为模糊匹配,忽略字母大小写,采用双引号进行精确匹配;
搜索特色功能包括:
2 内嵌正负面情感等极性分析,可以搜索任意对象的正负面结果;
2 语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以自行根据专业知识定制;
2 搜索结果去重:按照指定字段对搜索结果进行去重;
2 邻近搜索功能:可以要求两个关键词必须在一定的词场范围内。
2 内嵌了ICTCLAS智能分词系统。
2 数据库实时同步:数据库增删改10秒内即可同步到搜索引擎中
搜索维护功能包括:
2 支持增量索引:系统可以在搜索服务不停的前提下,继续索引新的数据,索引完成后,可以搜索新的数据;
2 自动备份与恢复机制,在建立索引和自动优化之前,在当前索引文件被破坏无法搜索的前提下,系统将自动恢复上次搜索正常的备份文件;
2 自动缓存机制:系统自动保存最近常用的搜索条件与结果,再次搜索时将直接推送搜索结果内容,可以将搜索响应速度提升30%以上;缓存会随着新的索引数据自动更新,不存在缓存延迟问题;
2 自动优化机制:在系统索引碎片较多时,系统会自动优化归并;
2 屏蔽指定文档、指定关键词的搜索服务,也可以恢复屏蔽信息;
2 实现的是多线程搜索服务;
2 兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等。系统支持多表关联搜索;支持Windows/Linux/FreeBSD等操作系统,支持C/C++/C#/Java二次开发。
共享包下载地址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/JZSearch
白皮书:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/JZSearch/doc