PDF转HTML不丢格式的软件:pdf2htmlEX
pdf2htmlEX 是一个将PDF文件转成HTML的工具,用到了一些流行的Web技术。旨在提供一个准确的渲染,同时专为Web显示而优化。
它针对 Mozilla Firefox & Google Chrome等浏览器进行优化。
特性:
- 单HTML文件输出
- 精确的渲染
- 文本抽取
- 针对web进行优化(包括减少文件大小,文字行合并,(为HTML文字选择)字体重编码等等)
还不支持:
- Type 3 字体
- 非文本对象 (不过不要担心,不支持的对象将直接转成图片)
项目主页:http://www.open-open.com/lib/view/home/1346900228178