PDF开发工具Aspose.PDF功能推荐——在.NET中将PDF转换为HTML
程序员文章站
2022-04-14 21:46:29
PDF是当今最流行的文档格式之一,各种应用程序将其用作最终输出。由于支持多种数据类型和可移植性,因此它是创建和共享内容的首选格式。作为对开发文档管理应用程序感兴趣的.NET应用程序开发人员,可能希望嵌入处理功能,以读取PDF文档并将其转换为其他文件格式,例如HTML。 下面,来探索并演示一下Aspo ......
pdf是当今最流行的文档格式之一,各种应用程序将其用作最终输出。由于支持多种数据类型和可移植性,因此它是创建和共享内容的首选格式。作为对开发文档管理应用程序感兴趣的.net应用程序开发人员,可能希望嵌入处理功能,以读取pdf文档并将其转换为其他文件格式,例如html。
下面,来探索并演示一下aspose.pdf for .net api的强大转换功能,以使用多种选项读取pdf文件并将其转换为html。
将html转换到pdf
只需使用几行代码和资源加载回调就可以以非常基本的方式将html转换为pdf,以下是使您达到目的的代码段:
// the path to the documents directory. string datadir = runexamples.getdatadir_asposepdf_documentconversion(); htmlloadoptions options = new htmlloadoptions(); options.customloaderofexternalresources = new loadoptions.resourceloadingstrategy(samepictureloader); document pdfdocument = new document(datadir + "htmltopdf.html", options); pdfdocument.save("htmltopdf_out.pdf");
将pdf转换为多页html
可以使用以下示例代码在将pdf转换为html的过程中,将上述步骤中的html分为多个页面。
// the path to the documents directory. string datadir = runexamples.getdatadir_asposepdf_documentconversion(); // open the source pdf document document pdfdocument = new document(datadir + "pdftohtml.pdf"); // instantiate html saveoptions object htmlsaveoptions htmloptions = new htmlsaveoptions(); // specify to split the output into multiple pages htmloptions.splitintopages = true; // save the document pdfdocument.save(@"multipagehtml_out.html", htmloptions);
将splitintopages标志设置为true可以为您完成所有工作,并且输出html由多个页面而不是单个页面组成。
将图像保存到特定文件夹
pdf文档除了文本详细信息外还可以包含图像。html可以包含html内基于64位编码的图像,也可以引用这些图像所在的文件夹中的图像。aspose.pdf api具有丰富的功能,可以将图像保存到光盘上用户指定的文件夹中。以下代码示例显示了在将pdf转换为html的过程中如何将图像保存到特定文件夹。
// create htmlsaveoption with tested feature htmlsaveoptions newoptions = new htmlsaveoptions(); // specify the separate folder to save images newoptions.specialfolderforallimages = datadir;