Apache UIMA Java SDK 2.7.0 发布

jopen 10年前

Apache UIMA Java SDK 2.7.0 发布,该版本包含主要功能增强和 bug 修复,要求 Java 7 或者更新版本。一些变化内容无法向后兼容,但可通过指定运行时的环境变量来优雅升级。详情请看 README 和 RELEASE_NOTES 文件。        UIMA是一个分析大容量非结构化数据以用于发现与终端用户相关知识的软件系统。一个UIMA的例子是输入普通文本和独立的实体,包括人、地点、组织;或者关系,包括供职于或位于。

         UIMA使得应用分解为多个组件,例如“语言标志”=》“特殊的语言分割”=》“句子边界检查”=》“实体检测(人、地点等)”。每一个组件实现了由框架提供的借口并且通过XML文件的形式提供了自我描述的元数据。框架控制组件及其之间的数据流。组件用Java或者C++书写;而组件之间的数据流是根据这些语言之间有效地映射而设计的。

         UIMA而外的提供了将组件整合成网络服务的能力并且通过复制一个网络节点簇之间的处理管道来扩大容量。

         Apache UIMA UIMA定义的Apache开源实现。我们邀请并鼓励你们参与应用与实现。

框架中的组件对于JavaC++都是可用的。Java构架支持Java和非Java组件(使用C++框架)。C++架构除了支持使用C/C++书写注解,而且支持PerlPython,和TCL注解。UIMA-AS扩展框架支持基于JMSActiveMQ的可扩展的能力。

    框架支持配置与运行注解组件之间的管道。这些组件的实际工作是分析非结构化信息。使用者可以书写自己的注解,也可以使用或配置已有的注解。一些注解在这个工程中,其余的在网络中。

其他的组件包括一个接收REST请求和返回注解结果的简单服务器以用于其他的网络服务。

Sandbox是可以将新的想法部署的地方以协作真个工程。

以下是整个UIMA的框架图。

Apache UIMA Java SDK 2.7.0 发布