java-POI處理excel文件方法
處理excel文件的開源庫有很多,常見的POI、jxls。。。。。
重點分析下POI處理excel的方法:
1、寫文件
// 按照行優先進行數據表格的初始化 public static void createRows() throws IOException { Workbook wb = new HSSFWorkbook(); // 創建表格 Sheet sheet = wb.createSheet("測試Sheet_01"); List<String> list = new ArrayList<String>(); list.add("a"); list.add("b"); int rowCount = list.size(); // 根據數據集設置行數 for (int i = 0; i < rowCount; i++) { Row row = sheet.createRow(i);// 創建行,表頭是第0行 for (int j = 0; j < list.size(); j++) { // 為第一個單元格賦值 Cell cell = row.createCell(0); cell.setCellValue("測試數據"); // 為第二個單元格賦值 Cell cell_1 = row.createCell(1); cell_1.setCellValue("test"); } } FileOutputStream fos = new FileOutputStream("/Users/file/測試的Excel.xls"); wb.write(fos); if (null != fos) { fos.close(); } System.out.println("測試數據完成輸出。。"); }
2、讀文件
// 將文件內容轉換為二維數組 @SuppressWarnings("resource") private static String[][] getData(FileItem fileItem, int ignoreRows) throws FileNotFoundException, IOException { List<String[]> result = new ArrayList<String[]>(); int rowSize = 0; BufferedInputStream in = new BufferedInputStream(fileItem.getInputStream()); Workbook wb; if (fileItem.getName().indexOf(".xlsx") > -1) { wb = new XSSFWorkbook(in); } else { wb = new HSSFWorkbook(in); } Cell cell = null; for (int sheetIndex = 0; sheetIndex < wb.getNumberOfSheets(); sheetIndex++) { Sheet st = wb.getSheetAt(sheetIndex); // 第一行為標題,不取 for (int rowIndex = ignoreRows; rowIndex <= st.getLastRowNum(); rowIndex++) { Row row = st.getRow(rowIndex); if (row == null) { continue; } int tempRowSize = row.getLastCellNum() + 1; if (tempRowSize > rowSize) { rowSize = tempRowSize; } String[] values = new String[rowSize]; Arrays.fill(values, ""); boolean hasValue = false; for (int columnIndex = 0; columnIndex <= row.getLastCellNum(); columnIndex++) { String value = ""; cell = row.getCell(columnIndex); if (cell != null) { //按照單元格數據類型進行數據處理 switch (cell.getCellType()) { case HSSFCell.CELL_TYPE_STRING: value = cell.getStringCellValue(); break; case HSSFCell.CELL_TYPE_NUMERIC: if (HSSFDateUtil.isCellDateFormatted(cell)) { Date date = cell.getDateCellValue(); if (date != null) { value = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(date); } else { value = ""; } } else { value = new DecimalFormat("0").format(cell.getNumericCellValue()); } break; case HSSFCell.CELL_TYPE_FORMULA: // 導入時如果為公式生成的數據則無值 if (!cell.getStringCellValue().equals("")) { value = cell.getStringCellValue(); } else { value = cell.getNumericCellValue() + ""; } break; case HSSFCell.CELL_TYPE_BLANK: break; case HSSFCell.CELL_TYPE_ERROR: value = ""; break; case HSSFCell.CELL_TYPE_BOOLEAN: value = (cell.getBooleanCellValue() == true ? "Y" : "N"); break; default: value = ""; } } if (columnIndex == 0 && value.trim().equals("")) { break; } values[columnIndex] = rightTrim(value); hasValue = true; } if (hasValue) { result.add(values); } } } in.close(); String[][] returnArray = new String[result.size()][rowSize]; for (int i = 0; i < returnArray.length; i++) { returnArray[i] = (String[]) result.get(i); } return returnArray; }
上述文件處理的過程能夠判斷單元格的數據類型,判斷邏輯較為繁瑣,如果是自行定義模板文件可以直接將文件模板中的單元格數據類型全部處理成文本類型;
這樣后臺程序全部按照字符串數據類型處理即可,相對容易,而且不易出錯。
3、容易出現的錯誤
對office2003和office2007的處理異常,異常如下
org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)
解決方法是按照上面的
fileItem.getName().indexOf(".xlsx")文件后綴的判斷邏輯進行分類處理即可。

浙公網安備 33010602011771號