0推荐
23K 浏览

Go语言写的分词模块:goseg

Go语言写的分词模块,使用了最大概率路径+单层神经网络。
jopen 10年前   
0推荐
24K 浏览

Jieba: 结巴中文分词

“结巴”中文分词:做最好的Python中文分词组件
jopen 10年前   
0推荐
85K 浏览
0推荐
76K 浏览

Java中文分词组件:word

Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Luce...
jopen 10年前   
0推荐
22K 浏览

基于CRFs的中文分词系统:Chinese Segmentor

Chinese Segmentor基于CRFs的中文分词系统,使用sgd训练,速度快,并且支持Online learning和Incremental learning,同时可以使用hadoop实...
0推荐
39K 浏览

C语言开源高性能中文分词器

Friso是使用C语言开发的一款高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。同时支持对UTF-8/GBK编码的切分。
jopen 11年前   
0推荐
58K 浏览

php高性能开源中文分词扩展

Robbe是建立在Friso中文分词器上的一个高性能php中文分词扩展,除了提供了基本的分词函数以外,还提供一些编码转换函。
jopen 11年前   
0推荐
19K 浏览

genius中文分词

genius中文分词,是基于crf条件随机场的分组件 Feature 支持pinyin分词 支持用户自定义break 支持用户自定义词典 支持词性标注
jopen 11年前   
0推荐
22K 浏览

Python 中文分词库“Yaha

"哑哈"中文分词,更快或更准确,由你来定义。通过简单定制,让分词模块更适用于你的需求。
jopen 11年前   
0推荐
123K 浏览

java版结巴分词:jieba-analysis

结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。
jopen 11年前   
0推荐
65K 浏览

C语言开源高性能中文分词器:friso

friso是使用c语言开发的一个中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。
jopen 12年前   
0推荐
67K 浏览

Java中文分词器 - Ansj

Ansj 是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法,比其他常用的开源分词工具(如mmseg4j)的分词准确率更高。
jopen 12年前   
0推荐
72K 浏览

中文分词器:jcseg

jcseg是使用Java开发的一个中文分词器,使用流行的mmseg算法实现。
jopen 12年前   
0推荐
68K 浏览

Python中文分词组件结巴:jieba

"结巴"中文分词:做最好的Python中文分词组件。支持两种分词模式: 1)默认模式,试图将句子最精确地切开,适合文本分析; 2)全模式,把句子中所有的可以成词的词语都扫描出来,适合搜索引擎。
jopen 12年前   
0推荐
56K 浏览

Ansj中文分词 - 开源的高准确率Java中文分词器

这是基于大名鼎鼎中科院的Ictclas中文分词算法编写的Java实现版本,比常用的开源mmseg4j的分词准确率高。目前我们自己站内的搜索将逐渐从mmseg4j算法替换成Ansj中文分词算法。
jopen 12年前   
0推荐
39K 浏览

基于HMM模型的中文分词:finalseg

HMM Model 基于HMM模型的中文分词
jopen 12年前   
0推荐
30K 浏览

Python 中文分词库 snailseg

Chinese Words Segment Library in Python 简单的中文分词库
jopen 12年前   
0推荐
104K 浏览

Lucene 3.6 中文分词、分页查询、高亮显示等

Lucene 3.6 中文分词、分页查询、高亮显示等
jopen 12年前   
0推荐
65K 浏览

Ansj 中文分词

这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化
jopen 12年前   
0推荐
40K 浏览

中文分词库 Chinese dialect convert

该软件是基于IK analyzer中文分词系统,以及基于知网的词语相似度计算一文,开发的能够将普通话转换为方言的分词翻译系统。软件采用基于词库的中文方言分词,对普通话的句子进行最大分词,从而进行方言的转换。
jopen 12年前   
1 2 3

经验分享,提升职场影响力

投稿

热门问答

    热门文档