PHP-ExcelReader:用于解析excel文件的PHP类库

fmms 13年前

PHP-ExcelReader是一个基于PHP的开源项目,其作用在于解析excel文件。

PHP-ExcelReader的官方网张如下:

http://phpexcelreader.sourceforge.net/

下载下来的文件结构如下图所示:

PHP-ExcelReader:用于解析excel文件的PHP类库

其中,Excel目录下的两个文件reader.php和oleread.inc是excel解析必须包含的文件,解析所需要的类与方法分别写在这 两个文件之中。其它的,example.php和example2.php两个文件是示例程序,jxlwtest.xls文件是示例程序需要解析的文件, 剩下的两个文件是自述文件。

 

PHP-ExcelReader的用法比较简单,下面四句代码是必须的:

require_once('Excel/reader.php');         // 引用Excel/reader.php文件,加载类库  $reader = new Spreadsheet_Excel_Reader(); // 实例化解析类Spreadsheet_Excel_Reader  $reader->setOutputEncoding("CP1251");     // 设置编码方式  $reader->read("jxlwtest.xls");            // 读取并解析文件(jxlwtest.xls为文件名)

上述四句代码执行完后,excel文件就解析完成了。解析的结果在数组$reader->sheets[0]中,包含maxrow、maxcol、numRows、numCols、cells、cellsInfo六项,其中有用的有numRows(行数)、numCols(列数)、cells(单元格内容)。要想获取excel文件的具体数据信息,遍历$reader->sheets[0][“cells”]数组即可。该数组是形如

$reader->sheets[0][“cells”][<行索引>][<列索引>] = <单元格中的值>

的二维数组,行索引和列索引均从1开始计数。

 

需要说明的是:

1.      Excel/reader.php文件中已经用require_once包含了oleread.inc文件,所以在调用的时候不需要加载oleread.inc。

2.      官方提供的excel文件jxlwtest.xls已经损坏,无法读取与解析。

3.      原始Excel/reader.php文件的第31行(如下)会导致错误:

require_once 'Spreadsheet/Excel/Reader/OLERead.php';

原因是Spreadsheet/Excel/Reader/OLERead.php文件不存在。其实这里所需的文件就是Excel/oleread.inc,把require_once后的文件名改成 ’oleread.inc’即可。

4.      原始Excel/reader.php文件的第261行会导致如下警告:

Deprecated: Assigning thereturn value of new by reference is deprecated

其原因是此行的 =& 符号已经在PHP 5.3中被废弃。根据该符号在此处的作用,直接将其改为 = 即可。

5.      PHP-ExcelReader不支持Excel 2007文档的解析,也就是说扩展名为xlsx的Excel文件不能使用本类库进行解析;它只针对扩展名为xls的Excel文件。

6.      PHP-ExcelReader的设置编码方法基于iconv命 令,setOutputEncoding方法的参数就是需要设置的字符集的名称。要使这个方法生效需要给本地的PHP环境安装iconv扩展;若本地 PHP环境没有iconv扩展,那么PHP-ExcelReader的编码方法默认为Unicode。关于iconv命令可参见如下链接:

http://www.cnblogs.com/xuxm2007/archive/2010/11/09/1872379.html

7.      PHP-ExceReader在解析整数的时候可能会出现精度上的误差,如58解析为57.5,原因不明。能做的就是解析完后检查下数据,然后四舍五入(如果有必要的话)。

8.      PHP-ExcelReader对于excel文件中的空白单元格,要么直接跳过不存放到结果数组中,要么保存为0或者””(空字符串)。