使用flying saucer将html转pdf经验分享
对比了很多生成pdf的方案,最终还是决定使用flying saucer,网上能搜出N多相关文章,但是照着做了会出现各种问题,还是得自己一点点摸索,前后花了两天时间才达到自己的目标,下面把过程中的经验总结一下,希望对大家能有所帮助:
1)jar包选择
小小抱怨一下,各种开源产品给了我们极大帮助,但是通常版本管理较为混乱,也给我们带来了不小的麻烦,因为jar包兼容性问题花了很长时间,尤其是itext,下载了最新的5.5.0 5.5.1版本居然里面都有错误的!最后试了各种版本,终于选定5.0.6版本。貌似无法上传附件,否则可以将jar上传,免得大家找起来麻烦。注意一下,我也是网上下载了一个别人修改过支持中文的jar包。
2)中文支持
首先需要添加中文字库,也就是你的页面中用到的所有字体:
ITextFontResolver fontResolver = renderer.getFontResolver(); fontResolver.addFont("C:/Windows/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); fontResolver.addFont("C:/Windows/Fonts/simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); fontResolver.addFont("C:/Windows/Fonts/simkai.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
上面这个很简单,到处都能找到示例代码,但是注意点来了:页面中字体不能使用中文,需要使用英文名称,而且是大小写敏感的!例如宋体的英文名称是 SimSun(注意不是simsun!,首字母都是大写的)
错误写法:font-family:宋体 或者 font-family:simsun
正确写法:font-family:SimSun 或者 font-family:SimHei
如果生成的pdf中文不显示或者乱码,请确认如下信息:
-
确保页面中所有内容都指定了字体,最好能指定 body {font-family:....},以防止漏网之鱼。
-
确保上述所有字体均通过addFont加入,字体名称错误或者字体不存在会抛出异常,很方便,但是没导入的字体不会有任何提示。
-
确保字体名称正确,不使用中文,大小写正确。
-
确保html标签都正确,简单的方法是所有内容都去掉,随便写几个中文看看能否正常生成,如果可以,在认真检查html标签,否则再次检查上述几条。
3)加密
加密方法较为简单:
ITextRenderer renderer = new ITextRenderer(); renderer.setPDFEncryption(getEncryption()); private PDFEncryption getEncryption() { PDFEncryption encrypt = new PDFEncryption(new String("a").getBytes(), new String("b").getBytes(), PdfWriter.ALLOW_SCREENREADERS); return encrypt; }
但是注意点来了,需要引入jar包!bcprov-jdk16-145.jar,百度一下很多的。
4)css样式
其实flying saucer对很多css都支持得不好,这个得自己慢慢试了,相当痛苦的过程,不过只要成功一个,其他的就简单了。
5)多页面生成pdf
其实很简单,第一个页面不变,从第二个起:
for(int i = 1; i < inputFile.length; i++) { renderer.setDocument(new File(root, inputFile[i])); renderer.layout(); renderer.writeNextDocument(); } renderer.finishPDF();
6)标签
<head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/> <link href="****.css" rel="stylesheet" type="text/css" /> <bookmarks> <bookmark name="a" href="#a" /> <bookmark name="b" href="#b" /> </bookmarks> </head>
其实就是在页面中增加锚点,然后在head中加入bookmark即可,但是注意点来了,如果你是将多个页面生成到一个pdf中,那么只要在最后一个页面中加入bookmark就可以了!否则会重复哦。