POI操作word2010实现多级标题结构

jopen 9年前

一、 问题背景:
项目中会生成word的报告,但是直接io流写的报告都是“正文”,没有生成标题,也就没法在大纲结构中方便的查看章节内容了。搜了很多资料也请教了一些同事,终于把这个目录结构的问题搞定了,在此和大家分享一下。

目前我们用的是office2010,因为word2010(2010版本word结构和2007差不多,应该也适用于2007)与 word2003的巨大差异,本方法可能不适用过低版本(主要是装卸office太耗时了),有低版本office的同学可以试试这个方法是否可行。


二、 准备工作:
1. JDK1.6或以上(1.8也试过是可以的,1.5的没试过了)。

2. 用的是maven管理配置,pom文件引入:

    <dependency>            <groupId>org.apache.poi</groupId>            <artifactId>poi-excelant</artifactId>            <version>3.9</version>        </dependency>  

三、 具体实现
1. 构建模板word。
创建一个word文档,例如D:/format.docx 。打开此文档,随便输入一行字符,例如输入: a 。 然后选中这一行,将其设置为“标题1”(或者大纲视图下的“1级”大纲)。保存,关闭format.docx。

2. 代码实现解析format.docx并新建word文档,写入标题到新建文档中。

    import java.io.FileInputStream;        import java.io.FileNotFoundException;        import java.io.FileOutputStream;        import java.io.IOException;                import org.apache.poi.xwpf.usermodel.XWPFDocument;        import org.apache.poi.xwpf.usermodel.XWPFParagraph;        import org.apache.poi.xwpf.usermodel.XWPFRun;        import org.apache.poi.xwpf.usermodel.XWPFStyles;        import org.apache.xmlbeans.XmlException;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTStyles;                public class WordTitle {            /**            * word整体样式            */            private static CTStyles wordStyles = null;                    /**            * Word整体样式            */            static {                XWPFDocument template;                try {                    // 读取模板文档                    template = new XWPFDocument(new FileInputStream("D:/format.docx"));                    // 获得模板文档的整体样式                    wordStyles = template.getStyle();                } catch (FileNotFoundException e) {                    e.printStackTrace();                } catch (IOException e) {                    e.printStackTrace();                } catch (XmlException e) {                    e.printStackTrace();                }            }                    public static void main(String[] args) throws Exception {                // 新建的word文档对象                XWPFDocument doc = new XWPFDocument();                // 获取新建文档对象的样式                XWPFStyles newStyles = doc.createStyles();                // 关键行// 修改设置文档样式为静态块中读取到的样式                newStyles.setStyles(wordStyles);                        // 开始内容输入                // 标题1,1级大纲                XWPFParagraph para1 = doc.createParagraph();                // 关键行// 1级大纲                para1.setStyle("1");                XWPFRun run1 = para1.createRun();                // 标题内容                run1.setText("标题 1");                        // 标题2                XWPFParagraph para2 = doc.createParagraph();                // 关键行// 2级大纲                para2.setStyle("2");                XWPFRun run2 = para2.createRun();                // 标题内容                run2.setText("标题 2");                        // 正文                XWPFParagraph paraX = doc.createParagraph();                XWPFRun runX = paraX.createRun();                // 正文内容                runX.setText("正文");                        // word写入到文件                FileOutputStream fos = new FileOutputStream("D:/myDoc.docx");                doc.write(fos);                fos.close();            }        }  

四、 特别说明

1. format.docx中只有标题1,虽然代码中设置了标题2(2级大纲),但是没有生效,“标题2”仍然是正文格式。如果想生效,需要在format.docx中新增一行,并设置为标题2(2级大纲)。

2. 一个奇怪的现象:设置完标题2,解析一次之后,再次将标题2设置为正文格式,或者删除,读取的wordStyles格式仍然能够设置标题2。

3. 大家可以打印下wordStyles,看看“标题1”附近的一些参数值,有助于理解和记忆。


五、 参考资料

参考了stackoverflow一篇关于POI的问题

最终解决问题,是这个链接给了灵感。老外用的是英文版的word,最终实现上还是和中文版的略有不同。

此外,大家往下看会发现一段代码,没有依赖模板,直接正向实现的。这种方式的实现,需要自己调整标题的字体大小、是否加粗等,个人感觉挺繁琐的。

具体实现如下(注意包的引入):

    import java.io.FileInputStream;        import java.io.FileNotFoundException;        import java.io.FileOutputStream;        import java.io.IOException;        import java.math.BigInteger;                import org.apache.poi.xwpf.usermodel.XWPFDocument;        import org.apache.poi.xwpf.usermodel.XWPFParagraph;        import org.apache.poi.xwpf.usermodel.XWPFRun;        import org.apache.poi.xwpf.usermodel.XWPFStyle;        import org.apache.poi.xwpf.usermodel.XWPFStyles;        import org.apache.xmlbeans.XmlException;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTDecimalNumber;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTOnOff;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTPPr;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTString;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTStyle;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTStyles;        import org.openxmlformats.schemas.wordprocessingml.x2006.main.STStyleType;                public class WordTitle {            /**            * word整体样式            */            private static CTStyles wordStyles = null;                    /**            * Word整体样式            */            static {                XWPFDocument template;                try {                    // 读取模板文档                    template = new XWPFDocument(new FileInputStream("D:/format.docx"));                    // 获得模板文档的整体样式                    wordStyles = template.getStyle();                } catch (FileNotFoundException e) {                    e.printStackTrace();                } catch (IOException e) {                    e.printStackTrace();                } catch (XmlException e) {                    e.printStackTrace();                }            }                    // 模板方式实现            public static void formatDoc() throws IOException {                // 新建的word文档对象                XWPFDocument doc = new XWPFDocument();                // 获取新建文档对象的样式                XWPFStyles newStyles = doc.createStyles();                // 关键行// 修改设置文档样式为静态块中读取到的样式                newStyles.setStyles(wordStyles);                        // 开始内容输入                // 标题1,1级大纲                XWPFParagraph para1 = doc.createParagraph();                // 关键行// 1级大纲                para1.setStyle("1");                XWPFRun run1 = para1.createRun();                // 标题内容                run1.setText("标题 1");                        // 标题2                XWPFParagraph para2 = doc.createParagraph();                // 关键行// 2级大纲                para2.setStyle("2");                XWPFRun run2 = para2.createRun();                // 标题内容                run2.setText("标题 2");                        // 正文                XWPFParagraph paraX = doc.createParagraph();                XWPFRun runX = paraX.createRun();                // 正文内容                runX.setText("正文");                        // word写入到文件                FileOutputStream fos = new FileOutputStream("D:/myDoc.docx");                doc.write(fos);                fos.close();            }                    // main            public static void main(String[] args) throws Exception {                // 读取模板方式写word                formatDoc();                        // 自定义样式方式写word                writeSimpleDocxFile();            }                    /**            * 自定义样式方式写word,参考statckoverflow的源码            *             * @throws IOException            */            public static void writeSimpleDocxFile() throws IOException {                XWPFDocument docxDocument = new XWPFDocument();                        // 老外自定义了一个名字,中文版的最好还是按照word给的标题名来,否则级别上可能会乱                addCustomHeadingStyle(docxDocument, "标题 1", 1);                addCustomHeadingStyle(docxDocument, "标题 2", 2);                        // 标题1                XWPFParagraph paragraph = docxDocument.createParagraph();                XWPFRun run = paragraph.createRun();                run.setText("标题 1");                paragraph.setStyle("标题 1");                        // 标题2                XWPFParagraph paragraph2 = docxDocument.createParagraph();                XWPFRun run2 = paragraph2.createRun();                run2.setText("标题 2");                paragraph2.setStyle("标题 2");                        // 正文                XWPFParagraph paragraphX = docxDocument.createParagraph();                XWPFRun runX = paragraphX.createRun();                runX.setText("正文");                        // word写入到文件                FileOutputStream fos = new FileOutputStream("D:/myDoc2.docx");                docxDocument.write(fos);                fos.close();            }                    /**            * 增加自定义标题样式。这里用的是stackoverflow的源码            *             * @param docxDocument 目标文档            * @param strStyleId 样式名称            * @param headingLevel 样式级别            */            private static void addCustomHeadingStyle(XWPFDocument docxDocument, String strStyleId, int headingLevel) {                        CTStyle ctStyle = CTStyle.Factory.newInstance();                ctStyle.setStyleId(strStyleId);                        CTString styleName = CTString.Factory.newInstance();                styleName.setVal(strStyleId);                ctStyle.setName(styleName);                        CTDecimalNumber indentNumber = CTDecimalNumber.Factory.newInstance();                indentNumber.setVal(BigInteger.valueOf(headingLevel));                        // lower number > style is more prominent in the formats bar                ctStyle.setUiPriority(indentNumber);                        CTOnOff onoffnull = CTOnOff.Factory.newInstance();                ctStyle.setUnhideWhenUsed(onoffnull);                        // style shows up in the formats bar                ctStyle.setQFormat(onoffnull);                        // style defines a heading of the given level                CTPPr ppr = CTPPr.Factory.newInstance();                ppr.setOutlineLvl(indentNumber);                ctStyle.setPPr(ppr);                        XWPFStyle style = new XWPFStyle(ctStyle);                        // is a null op if already defined                XWPFStyles styles = docxDocument.createStyles();                        style.setType(STStyleType.PARAGRAPH);                styles.addStyle(style);                    }        }  

来自:http://blog.csdn.net/oh_maxy/article/details/46515619