欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

PHP读取DOC 文件

程序员文章站 2022-05-16 09:58:38
...
PHP读取DOC文件时出问题。
百度的安装第三方包 来实现
系统提示 ** is not a word document....
求助

回复内容:

PHP读取DOC文件时出问题。
百度的安装第三方包 来实现
系统提示 ** is not a word document....
求助

可以使用一下PHPWord,要确保你的php版本是 PHP 5.3+

if($ext == 'docx'){
//docx文件可以直接读取
$contents = $this->extracttext($file);
}elseif($ext == 'doc'){
//doc文件,需要安装antiword软件来读取
$contents = shell_exec( "antiword -m UTF-8 $file" );
}else{
$contents = file_get_contents($file);
}

 function extracttext($filename) {
    $ext = end(explode('.', $filename));
    if($ext == 'docx')
        $dataFile = "word/document.xml";
    else
        $dataFile = "content.xml";
    $zip = new ZipArchive;
    if (true === $zip->open($filename)) {
        if (($index = $zip->locateName($dataFile)) !== false) {
            $text = $zip->getFromIndex($index);
            $xml = DOMDocument::loadXML($text, LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING);
            return strip_tags($xml->saveXML());
        }
        $zip->close();
    }
    return false;
}
相关标签: php