登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
中文分词
(共
60
篇经验)
0
推荐
23K
浏览
Go语言写的分词模块:goseg
Go语言写的分词模块,使用了最大概率路径+单层神经网络。
jopen
10年前
中文分词
goseg
0
推荐
24K
浏览
Jieba: 结巴中文分词
“结巴”中文分词:做最好的Python中文分词组件
jopen
10年前
中文分词
Jieba
0
推荐
85K
浏览
Lucene开发实例:Lucene中文分词
Lucene开发实例:Lucene中文分词
玫瑰情书
10年前
Lucene
中文分词
Lucene中文分词
Lucene开发实例
0
推荐
76K
浏览
Java中文分词组件:word
Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Luce...
jopen
10年前
中文分词
word
0
推荐
22K
浏览
基于CRFs的中文分词系统:Chinese Segmentor
Chinese Segmentor基于CRFs的中文分词系统,使用sgd训练,速度快,并且支持Online learning和Incremental learning,同时可以使用hadoop实...
jopen
11年前
中文分词
Chinese Segmentor
0
推荐
39K
浏览
C语言开源高性能中文分词器
Friso是使用C语言开发的一款高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。同时支持对UTF-8/GBK编码的切分。
jopen
11年前
中文分词
0
推荐
58K
浏览
php高性能开源中文分词扩展
Robbe是建立在Friso中文分词器上的一个高性能php中文分词扩展,除了提供了基本的分词函数以外,还提供一些编码转换函。
jopen
11年前
中文分词
0
推荐
19K
浏览
genius中文分词
genius中文分词,是基于crf条件随机场的分组件 Feature 支持pinyin分词 支持用户自定义break 支持用户自定义词典 支持词性标注
jopen
11年前
中文分词
0
推荐
22K
浏览
Python 中文分词库“Yaha
"哑哈"中文分词,更快或更准确,由你来定义。通过简单定制,让分词模块更适用于你的需求。
jopen
11年前
Python
中文分词
0
推荐
123K
浏览
java版结巴分词:jieba-analysis
结巴分词的原始版本为python编写,目前该项目在github上的关注量为170, 打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。
jopen
11年前
中文分词
jieba-analysis
0
推荐
65K
浏览
C语言开源高性能中文分词器:friso
friso是使用c语言开发的一个中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。
jopen
12年前
C语言
中文分词
0
推荐
67K
浏览
Java中文分词器 - Ansj
Ansj 是一个开源的 Java 中文分词工具,基于中科院的 ictclas 中文分词算法,比其他常用的开源分词工具(如mmseg4j)的分词准确率更高。
jopen
12年前
中文分词
0
推荐
72K
浏览
中文分词器:jcseg
jcseg是使用Java开发的一个中文分词器,使用流行的mmseg算法实现。
jopen
12年前
中文分词
0
推荐
68K
浏览
Python中文分词组件结巴:jieba
"结巴"中文分词:做最好的Python中文分词组件。支持两种分词模式: 1)默认模式,试图将句子最精确地切开,适合文本分析; 2)全模式,把句子中所有的可以成词的词语都扫描出来,适合搜索引擎。
jopen
12年前
Python
中文分词
0
推荐
56K
浏览
Ansj中文分词 - 开源的高准确率Java中文分词器
这是基于大名鼎鼎中科院的Ictclas中文分词算法编写的Java实现版本,比常用的开源mmseg4j的分词准确率高。目前我们自己站内的搜索将逐渐从mmseg4j算法替换成Ansj中文分词算法。
jopen
12年前
中文分词
0
推荐
39K
浏览
基于HMM模型的中文分词:finalseg
HMM Model 基于HMM模型的中文分词
jopen
12年前
中文分词
0
推荐
30K
浏览
Python 中文分词库 snailseg
Chinese Words Segment Library in Python 简单的中文分词库
jopen
12年前
Python
中文分词
0
推荐
104K
浏览
Lucene 3.6 中文分词、分页查询、高亮显示等
Lucene 3.6 中文分词、分页查询、高亮显示等
jopen
12年前
Lucene
中文分词
0
推荐
65K
浏览
Ansj 中文分词
这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化
jopen
12年前
中文分词
0
推荐
40K
浏览
中文分词库 Chinese dialect convert
该软件是基于IK analyzer中文分词系统,以及基于知网的词语相似度计算一文,开发的能够将普通话转换为方言的分词翻译系统。软件采用基于词库的中文方言分词,对普通话的句子进行最大分词,从而进行方言的转换。
jopen
12年前
中文分词
1
2
3
经验分享,提升职场影响力
投稿
热门问答
热门文档