C#编程实现Excel文档中搜索文本内容的方法及思路
程序员文章站
2023-12-20 12:16:04
打开excel的vba帮助,查看excel的对象模型,很容易找到完成这个功能需要的几个集合和对象:application、workbooks、workbook、worksh...
打开excel的vba帮助,查看excel的对象模型,很容易找到完成这个功能需要的几个集合和对象:application、workbooks、workbook、worksheets还有worksheet和range。application创建excel应用,workbooks打开excel文档,workbook获得excel文档工作薄,worksheets操作工作表集合,worksheet获得单个工作表。
搜索的思路对应上述集合和对象,可以这样表述:要搜索的文本可能存在excel文档当中的某个工作表上,搜索应该遍历目标excel文件的每个工作表中的有效区域,如果找到,则退出本次搜索,如果没有找到,则继续搜索直到完成本次搜索。
跟word对象模型不一样的是,excel对象模型没有提供find对象,不过没有关系,可以通过两种方法来实现,一个是通过range对象的find()方法来实现,另外一个比较麻烦,取得工作表worksheet的有效区域usedrange之后,遍历该range对象中的所有行列。实际开发中,用第二种方法时发现了一个特别的现象,所以第二种方法也准备详细记述一下。
第一步,打开excel文档:
object filename="";
object missingvalue=type.missing;
string strkeyword=""; //指定要搜索的文本,如果有多个,则声明string[]
excel.application ep=new excel.applicationclass();
excel.workbook ew=ep.workbooks.open(filename.tostring(),missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue);
然后准备遍历excel工作表:
excel.worksheet ews;
int iewscnt=ew.worksheets.count;
int i=0,j=0;
excel.range orange;
object otext=strkeyword.trim().toupper();
for(i=1;i<=iewscnt;i++)
{
ews=null;
ews=(excel.worksheet)ew.worksheets[i];
orange=null;
(excel.range)orange=((excel.range)ews.usedrange).find(
otext,missingvalue,missingvalue,
missingvalue,missingvalue,excel.xlsearchdirection.xlnext,
missingvalue,missingvalue,missingvalue);
if (orange!=null && orange.cells.rows.count>=1 && orange.cells.columns.count>=1)
{
messagebox.show("文档中包含指定的关键字!","搜索结果",messageboxbuttons.ok);
break;
}
}
这里要说两个值得注意的地方。一个是遍历工作表的索引,不是从0开始,而是从1开始;另外一个是find方法的第六个参数searchdirection,指定搜索的方向,帮助文档中说这个参数是可选项,但是我用missingvalue如论如何编译不能通过,不知什么原因,于是显式指定它的默认值xlnext。
第一种方法实现了,再看看第二种方法。这种方法除了要遍历工作表,还要对工作表使用区域的行和列进行遍历。其它一样,只对遍历说明,代码如下:
bool blflag=false;
int irowcnt=0,icolcnt=0,ibgnrow,ibgncol;
for(m=1;m<=iewscnt;m++)
{
ews=(excel.worksheet)ew.worksheets[m];
irowcnt=0+ews.usedrange.cells.rows.count;
icolcnt=0+ews.usedrange.cells.columns.count;
ibgnrow=(ews.usedrange.cells.row>1)?
ews.usedrange.cells.row-1:ews.usedrange.cells.row;
ibgncol=(ews.usedrange.cells.column>1)?
ews.usedrange.cells.column-1:ews.usedrange.cells.column;
for(i=ibgnrow;i
{
for(j=ibgncol;j
{
strtext=((excel.range)ews.usedrange.cells[i,j]).text.tostring();
if (strtext.toupper().indexof(strkeyword.toupper())>=0)
{
messagebox.show("文档中包含指定的关键字!","搜索结果",messageboxbuttons.ok);
}
}
}
}
显然这种方法比第一种繁琐得多,不过这里有一个关于遍历单元格的索引很特别的地方,当工作表中的使用区域usedrange为单行单列的时候,对usedrange中的单元格遍历起始索引值为1,为多行多列的时候,起始索引值为0,不知这是excel程序设计者出于什么样的考虑?
搜索的思路对应上述集合和对象,可以这样表述:要搜索的文本可能存在excel文档当中的某个工作表上,搜索应该遍历目标excel文件的每个工作表中的有效区域,如果找到,则退出本次搜索,如果没有找到,则继续搜索直到完成本次搜索。
跟word对象模型不一样的是,excel对象模型没有提供find对象,不过没有关系,可以通过两种方法来实现,一个是通过range对象的find()方法来实现,另外一个比较麻烦,取得工作表worksheet的有效区域usedrange之后,遍历该range对象中的所有行列。实际开发中,用第二种方法时发现了一个特别的现象,所以第二种方法也准备详细记述一下。
第一步,打开excel文档:
复制代码 代码如下:
object filename="";
object missingvalue=type.missing;
string strkeyword=""; //指定要搜索的文本,如果有多个,则声明string[]
excel.application ep=new excel.applicationclass();
excel.workbook ew=ep.workbooks.open(filename.tostring(),missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue,missingvalue,missingvalue,
missingvalue);
然后准备遍历excel工作表:
复制代码 代码如下:
excel.worksheet ews;
int iewscnt=ew.worksheets.count;
int i=0,j=0;
excel.range orange;
object otext=strkeyword.trim().toupper();
for(i=1;i<=iewscnt;i++)
{
ews=null;
ews=(excel.worksheet)ew.worksheets[i];
orange=null;
(excel.range)orange=((excel.range)ews.usedrange).find(
otext,missingvalue,missingvalue,
missingvalue,missingvalue,excel.xlsearchdirection.xlnext,
missingvalue,missingvalue,missingvalue);
if (orange!=null && orange.cells.rows.count>=1 && orange.cells.columns.count>=1)
{
messagebox.show("文档中包含指定的关键字!","搜索结果",messageboxbuttons.ok);
break;
}
}
这里要说两个值得注意的地方。一个是遍历工作表的索引,不是从0开始,而是从1开始;另外一个是find方法的第六个参数searchdirection,指定搜索的方向,帮助文档中说这个参数是可选项,但是我用missingvalue如论如何编译不能通过,不知什么原因,于是显式指定它的默认值xlnext。
第一种方法实现了,再看看第二种方法。这种方法除了要遍历工作表,还要对工作表使用区域的行和列进行遍历。其它一样,只对遍历说明,代码如下:
复制代码 代码如下:
bool blflag=false;
int irowcnt=0,icolcnt=0,ibgnrow,ibgncol;
for(m=1;m<=iewscnt;m++)
{
ews=(excel.worksheet)ew.worksheets[m];
irowcnt=0+ews.usedrange.cells.rows.count;
icolcnt=0+ews.usedrange.cells.columns.count;
ibgnrow=(ews.usedrange.cells.row>1)?
ews.usedrange.cells.row-1:ews.usedrange.cells.row;
ibgncol=(ews.usedrange.cells.column>1)?
ews.usedrange.cells.column-1:ews.usedrange.cells.column;
for(i=ibgnrow;i
{
for(j=ibgncol;j
{
strtext=((excel.range)ews.usedrange.cells[i,j]).text.tostring();
if (strtext.toupper().indexof(strkeyword.toupper())>=0)
{
messagebox.show("文档中包含指定的关键字!","搜索结果",messageboxbuttons.ok);
}
}
}
}
显然这种方法比第一种繁琐得多,不过这里有一个关于遍历单元格的索引很特别的地方,当工作表中的使用区域usedrange为单行单列的时候,对usedrange中的单元格遍历起始索引值为1,为多行多列的时候,起始索引值为0,不知这是excel程序设计者出于什么样的考虑?