Home » Resource资源
中文分词测试标准?
最近看了中文分词的测试语料库,发现人名往往切分为“姓”和“名字”;如R…
Read More »计算所汉语词性标记集
计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用…
Read More »商业搜索引擎新词发现基本原理
一般计算语言学方法:前提:一般只能拿到文本集合,而且往往是没有分词的;技术路…
Read More »汉字常用编码的字符集
GBK字符集合: GBK编码表.TXT(93.2 KB) GBK字符集合(去…
Read More »汉字的unicode、GB、GBK、BIG5编码
汉字编码问题 一、GB2312-80介绍 二、GB2312-80的扩展 三、…
Read More »JZSearch精准全文搜索引擎共享开发包 v10.0
JZSearch精准搜索引擎由北理工副教授张华平博士精心设计,具有专业精准、…
Read More »