使用Apache POI读取Excel文件
jopen
12年前
摘要: 适用于Microsoft Excel xls/xlsx两种类型电子表格的读取操作。
网上关于介绍Apache POI操作Excel的文章已经很多了,但都讲得比较复杂。poi的API 与实际使用中的Excel很类似,可以说是POI把Excel中的workbook、sheet、cell等对象化了,在实际使用中极易理解。但由于Apache POI在存在已有不短时间,至少在excel2007之前就已经出现,造成同样一套Api并不能同时读取(写入)xls和xlsx两种类型的Excel文件。但poi对excel有一个很好的抽象(ss包下的Workbook、Sheet、Cell等类),可以一定程度上忽略xls/xlsx的处理细节,针对其通用部分进行处理,但如果需要对各自有理强的支持,还是建议使用相应的API。
Apache POI 各个包功能描述:
HSSF - 提供读写Microsoft Excel XLS格式档案的功能。XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
HWPF - 提供读写Microsoft Word DOC格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读Microsoft Visio格式档案的功能。
HPBF - 提供读Microsoft Publisher格式档案的功能。
HSMF - 提供读Microsoft Outlook格式档案的功能。
下面给出一个简单的实现Demo:
[ExcelReader]
package net.yeah.likun_zhang.excel; import static net.yeah.likun_zhang.util.Debug.printf; import java.io.FileInputStream; import java.io.IOException; import java.text.SimpleDateFormat; import java.util.ArrayList; import java.util.List; import net.yeah.likun_zhang.util.Debug; import org.apache.commons.lang3.StringUtils; import org.apache.poi.hssf.usermodel.HSSFDateUtil; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; /** * 读取Excel 97~2003 xls格式 /2007~ xlsx格式 * @author ZhangLiKun * @mail likun_zhang@yeah.net * @date 2013-5-11 */ public class ExcelReader { /** * 创建工作簿对象 * @param filePath * @return * @throws IOException * @date 2013-5-11 */ public static final Workbook createWb(String filePath) throws IOException { if(StringUtils.isBlank(filePath)) { throw new IllegalArgumentException("参数错误!!!") ; } if(filePath.trim().toLowerCase().endsWith("xls")) { return new HSSFWorkbook(new FileInputStream(filePath)) ; } else if(filePath.trim().toLowerCase().endsWith("xlsx")) { return new XSSFWorkbook(new FileInputStream(filePath)) ; } else { throw new IllegalArgumentException("不支持除:xls/xlsx以外的文件格式!!!") ; } } public static final Sheet getSheet(Workbook wb ,String sheetName) { return wb.getSheet(sheetName) ; } public static final Sheet getSheet(Workbook wb ,int index) { return wb.getSheetAt(index) ; } public static final List<Object[]> listFromSheet(Sheet sheet) { int rowTotal = sheet.getPhysicalNumberOfRows() ; Debug.printf("{}共有{}行记录!" ,sheet.getSheetName() ,rowTotal) ; List<Object[]> list = new ArrayList<Object[]>() ; for(int r = sheet.getFirstRowNum() ; r <= sheet.getLastRowNum() ; r ++) { Row row = sheet.getRow(r) ; if(row == null)continue ; // 不能用row.getPhysicalNumberOfCells(),可能会有空cell导致索引溢出 // 使用row.getLastCellNum()至少可以保证索引不溢出,但会有很多Null值,如果使用集合的话,就不说了 Object[] cells = new Object[row.getLastCellNum()] ; for(int c = row.getFirstCellNum() ; c <= row.getLastCellNum() ; c++) { Cell cell = row.getCell(c) ; if(cell == null)continue ; cells[c] = getValueFromCell(cell) ; } list.add(cells) ; } return list ; } /** * 获取单元格内文本信息 * @param cell * @return * @date 2013-5-8 */ public static final String getValueFromCell(Cell cell) { if(cell == null) { printf("Cell is null !!!") ; return null ; } String value = null ; switch(cell.getCellType()) { case Cell.CELL_TYPE_NUMERIC : // 数字 if(HSSFDateUtil.isCellDateFormatted(cell)) { // 如果是日期类型 value = new SimpleDateFormat(DatePattern.LOCALE_ZH_DATE.getValue()).format(cell.getDateCellValue()) ; } else value = String.valueOf(cell.getNumericCellValue()) ; break ; case Cell.CELL_TYPE_STRING: // 字符串 value = cell.getStringCellValue() ; break ; case Cell.CELL_TYPE_FORMULA: // 公式 // 用数字方式获取公式结果,根据值判断是否为日期类型 double numericValue = cell.getNumericCellValue() ; if(HSSFDateUtil.isValidExcelDate(numericValue)) { // 如果是日期类型 value = new SimpleDateFormat(DatePattern.LOCALE_ZH_DATE.getValue()).format(cell.getDateCellValue()) ; } else value = String.valueOf(numericValue) ; break ; case Cell.CELL_TYPE_BLANK: // 空白 value = ExcelConstants.EMPTY_CELL_VALUE ; break ; case Cell.CELL_TYPE_BOOLEAN: // Boolean value = String.valueOf(cell.getBooleanCellValue()) ; break ; case Cell.CELL_TYPE_ERROR: // Error,返回错误码 value = String.valueOf(cell.getErrorCellValue()) ; break ; default:value = StringUtils.EMPTY ;break ; } // 使用[]记录坐标 return value + "["+cell.getRowIndex()+","+cell.getColumnIndex()+"]" ; } }
测试类[ExcelReaderTest]
package net.yeah.likun_zhang.excel; import java.io.FileNotFoundException; import java.io.IOException; import java.util.List; import net.yeah.likun_zhang.BaseTest; import net.yeah.likun_zhang.util.Debug; import net.yeah.likun_zhang.util.ToString; import org.apache.commons.lang3.StringUtils; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.junit.Test; /** * 读取 * @author ZhangLiKun * @mail likun_zhang@yeah.net * @date 2013-5-8 */ public class ExcelReaderTest extends BaseTest{ @Test public void testRead() throws FileNotFoundException, IOException { Workbook wb = ExcelReader.createWb("src/main/resources/excels/demo-3.xlsx") ; // 获取Workbook中Sheet个数 int sheetTotal = wb.getNumberOfSheets() ; Debug.printf("工作簿中的工作表个数为:{}" ,sheetTotal); // 获取Sheet Sheet sheet = ExcelReader.getSheet(wb, 0) ; // 遍历Sheet List<Object[]> list = ExcelReader.listFromSheet(sheet) ; Debug.printf(list, new ToString<Object[]>(){ private int index = 1 ; @Override public String toString(Object[] t) { if(t == null || t.length == 0)return StringUtils.EMPTY ; StringBuffer sb = new StringBuffer(index ++ + ":") ; for(int i = 0 ,len = t.length ; i < len ; i++) { sb.append(t[i] + ",") ; } return sb.toString(); } }) ; } }
测试辅助类[Debug]
package net.yeah.likun_zhang.util; import java.util.Collection; import java.util.Iterator; import org.apache.commons.lang3.ArrayUtils; /** * Debug函数库 * @author ZhangLiKun * @mail likun_zhang@yeah.net * @date 2013-5-8 */ public class Debug { /** * 打印函数 * @param objects * @date 2013-5-8 */ public static final void printf(String msg ,Object ...objects) { if(ArrayUtils.isEmpty(objects)) { System.out.println(msg); return ; } for(int i = 0 ,len = objects.length ; i < len ; i ++) { Object obj = objects[i] ; msg = msg.replaceFirst("\\{\\}", obj == null ? "" : obj.toString()) ; } System.out.println(msg); } /** * 打印函数 * @param obj * @date 2013-5-8 */ public static final void printf(Object obj) { if(obj != null){ System.out.println(obj.toString()); } } /** * 打印集合 * @param list * @param ts * @date 2013-5-8 */ public static final <T> void printf(Collection<T> list ,ToString<T> ts) { if(list == null || list.isEmpty()) return ; Iterator<T> iter = list.iterator() ; while(iter.hasNext()) { T t = iter.next() ; // if(t == null)continue ; if(ts == null) { System.out.println(t.toString()); } else { String msg = ts.toString(t) ; // if(msg != null) { System.out.println(msg); // } } } } }