欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

浅析php插件 HTMLPurifier HTML解析器

程序员文章站 2022-06-30 10:50:09
htmlpurifier插件的使用下载htmlpurifier插件htmlpurifier插件有用的部分是 library 使用htmlpurifier library类...
htmlpurifier插件的使用
下载htmlpurifier插件
htmlpurifier插件有用的部分是 library

浅析php插件 HTMLPurifier HTML解析器
使用htmlpurifier library类库
第一种方式

复制代码 代码如下:

<?php
require_once 'htmlpurifier.auto.php';
$config = htmlpurifier_config::createdefault();
?>

或者
复制代码 代码如下:

<?php
require_once 'htmlpurifier.includes.php';
require_once 'htmlpurifier.autoload.php';
$config = htmlpurifier_config::createdefault();
?>

官网给出的例子是
复制代码 代码如下:

require_once 'htmlpurifier.auto.php';

我同事常用的是
复制代码 代码如下:

require_once 'htmlpurifier.includes.php';
require_once 'htmlpurifier.autoload.php';

设置$config
configdoc
例子
复制代码 代码如下:

$config->set('html.allowedelements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('html.doctype', 'xhtml 1.0 transitional')  //html文档类型(常设)
$config->set('core.encoding', 'utf-8')   //字符编码(常设)

html允许的元素
div元素,table元素,tr元素,td元素,br元素
new htmlpurifier对象
复制代码 代码如下:

$purifier = new htmlpurifier($config);

调用htmlpurifier对象的purify方法
复制代码 代码如下:

$puri_html = $purifier->purify($html);

第二种方式
自定义一个类 htmlpurifier.php
复制代码 代码如下:

<?php
require_once 'htmlpurifier.includes.php';
require_once 'htmlpurifier.autoload.php';
class resume_htmlpurifier implements zend_filter_interface{
 protected $_htmlpurifier = null;
 public function __construct($options = null)
 {
  $config = htmlpurifier_config::createdefault();
  $config->set('code.encoding', 'utf-8'); 
  $config->set('html.doctype', 'xhtml 1.0 transitional')
  if(!is_null($options)){
   foreach($options as $option){
    $config->set($option[0], $option[1], $option[2]);
   }
  }
  $this->_htmlpurifier = new htmlpurifier($config);
 }
 public function filter($value)
 {
 return $this->_htmlpurifier->purify($value);

 }
}
?>

设置config信息
例如:
复制代码 代码如下:

$conf = array(
 array('html.allowedelements',
           array(
                     'div' => true,
                     'table' => true,
                     'tr' => true,
                     'td' => true,
                     'br' => true,
                 ),
                 false), //允许属性 div table tr td br元素
         array('html.allowedattributes', array('class' => true), false),  //允许属性 class
         array('attr.forbiddenclasses', array('resume_p' => true), false), //禁止classes如
         array('autoformat.removeempty', true, false),    //去空格
         array('autoformat.removeempty.removenbsp', true, false),  //去nbsp
         array('uri.disable', true, false),
);

调用
复制代码 代码如下:

$p = new resume_htmlpurifier($conf);
$puri_html = $p->filter($html);