文件的元数据提取库,GNU libextractor 1.0.0 发布

jopen 12年前

libextractor是一个库,用于从任意类型的文件中提取元数据。其目的是为开发人员提供一个通用库,在文件共享网络,文件管理器,WWW索引机器人等使用场景中可以获得有关文件的元数据。它包括了一个shell命令,并为Java(JNI)和Python提供绑定。

这次是主是插件机制的重大变化,现在允许进程外插件完全随机访问整个文件。大部分插件都已经采用新的插件API进行了重构。外部(libextractor)API保持不变,兼容0.6。在重写的一部分,许多插件被改变,使用标准的第三方的库进行解析(包括:libjpeg, libtiff, libgif, libtidy,和 libmagic)。基于GStreamer的一个新的插件来取代许多现有的多媒体插件。 几乎所有的插件都有编写自动化测试的用例,相应的文档也有更新。