JZSearch精准全文搜索引擎共享开发包 v10.0

JZSearch精准搜索引擎由北理工副教授张华平博士精心设计,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。目前已经应用于中国邮政搜索引擎、河北省标准搜索引擎、富基融通(纳斯达克上市公司:EFUT)商品搜索以及新疆维文搜索引擎。

同时,全文搜索中间件通过可视化界面,可以快速地配置相关参数,启动搜索服务,并提供测试程序,可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。

搜索基本功能包括:

2  多字段关联搜索:非结构化与结构化字段的关联搜索,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;

2  指定字段排序:可以按照任意指定字段的排序;

2  精确搜索:支持精确匹配以及模糊匹配,默认为模糊匹配,忽略字母大小写,采用双引号进行精确匹配;

搜索特色功能包括:

2  内嵌正负面情感等极性分析,可以搜索任意对象的正负面结果;

2  语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以自行根据专业知识定制;

2  搜索结果去重:按照指定字段对搜索结果进行去重;

2  邻近搜索功能:可以要求两个关键词必须在一定的词场范围内。

2  内嵌了ICTCLAS智能分词系统。

2  数据库实时同步:数据库增删改10秒内即可同步到搜索引擎中

搜索维护功能包括:

2  支持增量索引:系统可以在搜索服务不停的前提下,继续索引新的数据,索引完成后,可以搜索新的数据;

2  自动备份与恢复机制,在建立索引和自动优化之前,在当前索引文件被破坏无法搜索的前提下,系统将自动恢复上次搜索正常的备份文件;

2  自动缓存机制:系统自动保存最近常用的搜索条件与结果,再次搜索时将直接推送搜索结果内容,可以将搜索响应速度提升30%以上;缓存会随着新的索引数据自动更新,不存在缓存延迟问题;

2  自动优化机制:在系统索引碎片较多时,系统会自动优化归并;

2  屏蔽指定文档、指定关键词的搜索服务,也可以恢复屏蔽信息;

2  实现的是多线程搜索服务;

2  兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQLDB2等。系统支持多表关联搜索;支持Windows/Linux/FreeBSD等操作系统,支持C/C++/C#/Java二次开发。

 

共享包下载地址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/JZSearch 

白皮书:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/JZSearch/doc 

 

You May Also Like

About the Author: nlpir

发表回复