Home » Resource资源

中文分词测试标准?

最近看了中文分词的测试语料库,发现人名往往切分为“姓”和“名字”;如&#82…

Read More »

计算所汉语词性标记集

计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用…

Read More »

LJCluster汉语文档聚类

      LJ…

Read More »

商业搜索引擎新词发现基本原理

一般计算语言学方法:前提:一般只能拿到文本集合,而且往往是没有分词的;技术路…

Read More »

中国汉语方言分布图

Read More »

汉字常用编码的字符集

GBK字符集合: GBK编码表.TXT(93.2 KB) GBK字符集合(去…

Read More »

汉字的unicode、GB、GBK、BIG5编码

汉字编码问题 一、GB2312-80介绍 二、GB2312-80的扩展 三、…

Read More »

JZSearch精准全文搜索引擎共享开发包 v10.0

JZSearch精准搜索引擎由北理工副教授张华平博士精心设计,具有专业精准、…

Read More »