PHP的PDF解析库:PdfParser 发布 0.9.20 版本

jopen 11年前

PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。功能包括:

  • Load/parse objects and headers
  • Extract meta data (author, description, ...)
  • Extract text from ordered pages
  • Support of compressed pdf
  • Support of MAC OS Roman charset encoding
  • Handling of hexa and octal encoding in text sections
  • PSR-0 compliant (autoloader)
  • PSR-1 compliant (code styling)

发布说明: 该版本修正了一些错误的解析(字体,安全文件等)。TCPDF依赖需要更新。

项目主页:http://www.open-open.com/lib/view/home/1378364958500