欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

如何使用C#从word文档中提取图片

程序员文章站 2022-06-03 13:06:08
图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现如何使...

图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现如何使用c#从word文档中提取图片。

这里我准备了一个含有文字和图片的word文档:

如何使用C#从word文档中提取图片 

详细步骤与代码:

步骤1 : 添加引用。

新建一个visual c#控制台项目,添加引用并使用如下命名空间:

using system;
using spire.doc;
using spire.doc.documents;
using spire.doc.fields;

步骤2 : 新建一个word文档对象并加载需要提取图片的word文档。

document document = new document("法国景点.docx ");

步骤3 : 遍历文档中的所有section,找到图片,将它们提取出来并保存。

int index = 0;
//获取文档的section
foreach (section section in document.sections)
{
//获取section中的段落
foreach (paragraph paragraph in section.paragraphs)
{
//获取段落中的文档对象
foreach (documentobject docobject in paragraph.childobjects)
{
//对对象的type进行判断,如果是图片,就提取出来
if (docobject.documentobjecttype == documentobjecttype.picture)
{
docpicture picture = docobject as docpicture; 
//给图片命名
string imagename = string.format(@"images\image-{0}.png", index); 
//保存图片
picture.image.save(imagename, system.drawing.imaging.imageformat.png);
index++;
}
}
}
}

提取出来的图片:

如何使用C#从word文档中提取图片 

全部代码:

using system;
using spire.doc;
using spire.doc.documents;
using spire.doc.fields;
using system.drawing;
namespace extract_image_from_word
{
class program
{
static void main(string[] args)
{
document document = new document("法国景点.docx");
int index = 0; 
foreach (section section in document.sections)
{
foreach (paragraph paragraph in section.paragraphs)
{
foreach (documentobject docobject in paragraph.childobjects)
{
if (docobject.documentobjecttype == documentobjecttype.picture)
{
docpicture picture = docobject as docpicture;
string imagename = string.format(@"images\image-{0}.png", index); 
picture.image.save(imagename, system.drawing.imaging.imageformat.png);
index++;
}
}
}
}
}
}
}

总结:

这里我使用的是e-iceblue公司的免费 word 组件,它除了可以从文档中提取图片,还可以提取文本,这里我只写了提取图片的,提取文本的也差不多,如有需要可以留言。