Java如何获取word文档的条目化内容
程序员文章站
2024-02-11 20:18:28
在开发web办公系统或文档系统时,pageoffice组件是众所周知的在线处理微软word/ppt/excel文档的强大工具,它对word文档的各种处理在api层面进行了封...
在开发web办公系统或文档系统时,pageoffice组件是众所周知的在线处理微软word/ppt/excel文档的强大工具,它对word文档的各种处理在api层面进行了封装,屏蔽了office vba接口的复杂性,而又不失vba的强大功能,在此要分享的正是pageoffice封装的一个很强大的功能:获取word文档的条目化内容。在一个包含了文档处理功能的办公系统里,用户出于各种原因,希望能通过程序自动分析word文档中每个章节的内容也是一种合理的需求,而pageoffice为实现此功能提供的接口也非常简单,废话少说,直接看代码:
pageoffice具体的集成过程在此略过。。。(详细看pageoffice for java 开发包中的安装说明)
1. 调用pageoffice在线打开一个包含了章节层次的word文档,比如:test.doc
pageofficectrl poctrl=new pageofficectrl(request); poctrl.setserverpage(request.getcontextpath()+"/poserver.zz"); //打开word文档 poctrl.webopen("doc/test.doc",openmodetype.docnormaledit,"张佚名");
2. 在打开word文件的页面(比如:word.jsp)里显示文件的区域添加pageoffice的代码:
<div style=" width:1000px; height:650px;"> <%=poctrl.gethtmlcode("pageofficectrl1")%> </div>
3. 文件在线打开之后,通过按钮或其他方式调用执行下面的js,变量txt就可以获取到文档条目化的内容:
var txt = document.getelementbyid("pageofficectrl1").getworditemsconent();
4. 运行效果:
总结
以上所述是小编给大家介绍的java如何获取word文档的条目化内容,希望对大家有所帮助
上一篇: WPF绑定实例详解