欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

去除 HTML 标记,javascript 代码的小函数

程序员文章站 2022-04-08 13:18:46
...
  1. function trip_html( $html, $len ) {
  2. // $html 应包含一个 HTML 文档。
  3. // 本例将去掉 HTML 标记,javascript 代码
  4. // 和空白字符。还会将一些通用的
  5. // HTML 实体转换成相应的文本。
  6. $search = array (“‘’si”, // 去掉 javascript
  7. “‘]*?>’si”, // 去掉 HTML 标记
  8. “‘([\r\n])[\s]+’”, // 去掉空白字符
  9. “‘&(quot|#34);’i”, // 替换 HTML 实体
  10. “‘&(amp|#38);’i”,
  11. “‘&(lt|#60);’i”,
  12. “‘&(gt|#62);’i”,
  13. “‘&(nbsp|#160);’i”,
  14. “‘&(iexcl|#161);’i”,
  15. “‘&(cent|#162);’i”,
  16. “‘&(pound|#163);’i”,
  17. “‘&(copy|#169);’i”,
  18. “‘(\d+);’e”); // 作为 PHP 代码运行
  19. $replace = array (“”,
  20. “”,
  21. “\\1″,
  22. “\”",
  23. “&”,
  24. ““>”,
  25. “ ”,
  26. chr(161),
  27. chr(162),
  28. chr(163),
  29. chr(169),
  30. “chr(\\1)”);
  31. $text = preg_replace ($search, $replace, $html);
  32. $text = trim($text);
  33. return mb_strlen($text) >= $len ? mb_substr($text, 0, $len) : ”;
  34. }
  35. ?>
复制代码