"结巴"中文分词的C++版本：CppJieba

jopen 10年前

简介

CppJieba是"结巴"中文分词的C++版本

收到邮件询问跨语言包装(ios应用开发)使用的问题，这方面我没有相关的经验，建议参考如下python使用cppjieba的项目：

jannson 开发的供 python模块调用的项目 cppjiebapy , 和相关讨论 cppjiebapy_discussion .

如果有需要在node.js中使用分词，不妨试一下NodeJieba。

如果有需要在处理中文文档的的相似度计算，不妨试一下simhash。

如果有需要在erlang中使用分词的话，不妨试一下exjieba。

如果有需要在R中使用分词的话，不妨试一下jiebaR。

libcppjieba 是最简单易懂的CppJieba头文件库使用示例。

KeywordServer 50行搭建一个中文关键词抽取服务。

如果有需要在Nginx中使用分词模块的话，不妨试一下ngx_http_cppjieba_module.