个人笔记-java解析文本并转换生成Excel文件
2017-05-30 本文已影响0人
王雨城
本篇要点:
1、文件读写的基本操作
2、字符串分割
3、POI生成Excel文件(.xlsx)
需求:
将csv格式的数据文件的内容导入到表格中,生成xlsx格式的文件。
(这是个很简单的任务,这里记录一下,以便以后复用代码。)
转换前:
转换后:
转换后的xlsx文件起因:
思路:
整体思路
1、按行读取文件数据,过滤掉不必要的行。
2、有效行进行数据分割。
3、分割好的数据存入表格的单元格。
4、输出生成xlsx文件。
用记事本打开csv文件分析一下,发现需要解决的问题主要有:
1、开头有多余代码
开头多余代码
2、有重复的标题行,每行末尾有无效数据(,,,,)
无效数据读取行的详细思路
1、正则匹配“+”开头的行(称为“+”行)并计数,只有读取“+”行计数为1时,置布尔值title_read为true,表示下一行可以读取为标题行。
2、当“+”行计数>=1时,读取的非“+”行才是有效行,这样就可以忽略开头代码。
3、当“+”行计数!=1时,置title_read为false,表示之后不再读取标题行。无效标题行的判断条件为title_read为false时“+”行计数为基数(因为每个标题行前后都有一行“+”行)。这样就可以忽略掉多余标题行。
4、进行字符串切割后,不输出第一个(第一个“|”前是空字符串)和最后一个切割数据(“,,,,,”无效数据)。
完整代码
因为这是个人笔记,就不细讲每一步的实现了,代码比较简单,细节见注释。
package excelOP;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import org.apache.poi.xssf.streaming.SXSSFRow;
import org.apache.poi.xssf.streaming.SXSSFSheet;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
public class ExcelOp {
public void trans(String file_in,String file_out//参数file_in,file_out分别为输入文件路径和输出文件路径
){
/*实例化输入、输出流*/
File f_in=new File(file_in);//输入文件
FileInputStream ips=null;
InputStreamReader ipsr=null;
File f_out=new File(file_out);//输出文件
FileOutputStream ops=null;
try {
ips=new FileInputStream(f_in);
ipsr=new InputStreamReader(ips);
ops=new FileOutputStream(f_out);
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
/*创建excel表格文件并输出*/
//创建工作薄
SXSSFWorkbook wb = new SXSSFWorkbook();
try {
//创建新的一页
SXSSFSheet sheet = wb.createSheet("new sheet");
BufferedReader br=new BufferedReader(ipsr);
int count_title_framelines=0;
boolean title_read=false;
String valueString = null;
int count_line=0;//表格的有效行计数
while ((valueString=br.readLine())!=null){//循环处理每一行
if(valueString.matches("\\+.+")){//正则匹配标题前后行“+”开头的行
count_title_framelines++;
if(count_title_framelines==1)title_read=true;
else title_read=false;
}
else{//非“+”开头的行
if(!(title_read==false&&count_title_framelines%2==1)//忽略重复标题行
&&count_title_framelines>=1){//忽略开头代码
//分解每一行有效行
String[] strs_cell=valueString.split("\\|");//用“|”切割每一行作为一个单元格数据
SXSSFRow row = sheet.createRow((short)count_line);
for(int i=1;i<strs_cell.length-1;++i){//循环每个切割得到的数据,除了最后一个(,,,)和第一个(空)
//创建要显示的内容,创建一个单元格,第一个参数为列坐标,第二个参数为行坐标,第三个参数为内容
row.createCell((short)i-1).setCellValue(strs_cell[i]);
System.out.println("正在导入第"+count_line+"行……");
}
count_line++;
}
}
}
//把创建的表格写入到输出流中,并关闭输出流
wb.write(ops);
}catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}finally {
if(wb!=null){
try {
wb.close();
System.out.println("写入表格完毕!");
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
if(ips!=null){
try {
ips.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
if(ops!=null){
try {
ops.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
}
public static void main(String[] args) {
// TODO Auto-generated method stub
ExcelOp exop=new ExcelOp();
exop.trans("Ngap.csv", "test.xlsx");
}
}
参考:
POI操作Excel常用方法总结
注:这篇主要讲的是用HSSF生成xls格式的文件(Excel2003版之前用的格式),生成xlsx用的是SXSSF,如上个部分的代码。不过相应的操作大同小异,把所有的“HSSF”改成“SXSSF”即可,相应的包可以到Apache官网下载,给个链接:Apache POI - Download Release Artifacts