登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
中文分词类库
(共
6
篇项目)
0
推荐
638
浏览
smallseg
smallseg -- 开源的,基于DFA的轻量级的中文分词工具包 特点:可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力。
码头工人
6年前
中文分词类库
0
推荐
722
浏览
paoding
Paoding's Knives中文分词具有极高效率和高扩展性。引入隐喻,采用完全的面向对象设计,构思先进。高效率:在PIII 1G内存个人机器上,1秒可准确分词100万汉字。采用基于不限制个数...
码头工人
6年前
中文分词类库
0
推荐
588
浏览
imdict
imdict-chinese-analyzer是imdict智能词典的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model,HMM),是中国科学院计算技术研究所的ic...
码头工人
6年前
中文分词类库
0
推荐
513
浏览
mmseg4j
mmseg4j用Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中...
码头工人
6年前
中文分词类库
0
推荐
925
浏览
IKAnalyzer
IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应...
码头工人
6年前
中文分词类库
0
推荐
883
浏览
ictclas4j
ictclas4j中文分词系统是sinboy在中科院张华平和刘群老师的研制的FreeICTCLAS的基础上完成的一个java开源分词项目,简化了原分词程序的复杂度,旨在为广大的中文分词爱好者一个更好的学习机会。
码头工人
6年前
中文分词类库
推荐项目
热门问答
热门文档