Digester 基于规则的XML文档解析,主要用于XML到Java对象的映射。Struts就是用Digester来处理XML配置文件的。而且Digester还包含一个写好的RSS解析器。 下面是一段使用
Digester 3.2 发布了, Digester 是一个基于规则的XML文档解析库,主要用于XML到Java对象的映射。Struts就是用Digester来处理XML配置文件的。而且Digester还包含一个写好的RSS解析器。
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。
从文档(office,pdf,hwp)抽取文本的Java类库:JSearch。 Download & Installation JSearch.jar Just import JSearch.jar
Aspose.Pdf.Kit 是一个 Java 的组件用来操作 PDF 文档。 4.0 版本包含两个跟文本抽取相关的新特性:抽取文本到 HTML 以及获得所抽取文本的格式化信息。其他方面都是bug的修复。
Archive - zip, tar, gzip, bzip等 RTF - Tika提供 Java class - Class解析由ASM完成 Image - 只支持图像的元数据抽取 XML
用Java实现基于SOAP的XML文档网络传输及远程过程调用(RPC) SOAP(Simple Object Access Protocol,简单对象访问协议) 是一种基于XML的,用于计算机之间交
MathOCR是一个用Java语言编写的印刷体科技文档识别系统,在GNU通用公共许可证版本3或(按你的意愿)更新版本下发布。 MathOCR具备基本的图形预处理、版面分析和字符识别能力,特别是能够
Apache POI 是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。 结构: HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
PDFBox 是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成
ClassLoader 当JVM(Java虚拟机)启动时,会形成由三个类加载器组成的初始类加载器层次结构: bootstrap classloader |
Bean 1. 开发环境 1.1 MyEclipse7.0 1.2 jboss4.2.2GA应用服务器 1.3 EJB3 1.4 MYSQL数据库 2. 配置环境 2.1 配置数据库jndi:java:/EricDs
第一步,安装JDK 官方下载地址为: http://www.oracle.com/technetwork/java/javase/downloads/jdk-6u27-download-440405.html
Orient DB 是一个可扩展的文档数据库,支持 ACID 事务处理。使用 Java 5 实现。使用示例: // OPEN THE DATABASE ODatabaseDocumentTx db =
基金会 宣布 Apache POI 十周年了。Apache POI是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。这样一个项目能坚持 10 一直到今天,真是非常的不容易。目前 POI
Orient DB 是一个可伸缩的文档数据库,支持 ACID 事务处理。使用 Java 5 实现。 OrientDB 1.0 RC9 发布,主要更新包括: 1. 新的界面外观以及改进了查询面板
Apache POI 是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。 结构: HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
Orient DB 是一个可伸缩的文档数据库,支持 ACID 事务处理。使用 Java 5 实现。 OrientDB 1.0 正式版发布了,主要改进内容包括: 全新的多 Master 的复制体系结构
更多内容请看 发行说明 。 Apache POI 是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。 结构: HSSF - 提供读写Microsoft
了解了Java8中所有包的作用,对Java8有了一个整体的了解,另外也是提高了自身的阅读能力。 http://code.csdn.net/translations/97 这是我参与的一个翻译项目“