欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

一个比较全面的截取函数(多用于采集内容的分析)

程序员文章站 2024-01-17 23:58:58
...
  1. /*

  2. 采集截取函数,主要用于分析采集的内容
  3. getcon - 截取后去掉html字符,并去掉空格
  4. getcon2 - 单纯截取,直接返回截取内容。
  5. 参数:
  6. $par可接受两种格式:
  7. 1.前面字符{DATA}后面字符
  8. 2.正则表达式
  9. */
  10. function getcon($pat,$str){

  11. $title_var=explode("{DATA}",$pat);
  12. if(count($title_var)>1){
  13. $title_1=explode($title_var[0],$str);
  14. $title_2=explode($title_var[1],$title_1[1]);
  15. return strip_s(strip_tags($title_2[0]));
  16. }else{
  17. preg_match_all($pat,$str,$res);
  18. return strip_s(strip_tags($res[1][0]));
  19. }
  20. }
  21. function getcon2($pat,$str){
  22. $title_var=explode ("{DATA}",$pat);
  23. if(count($title_var)>1){
  24. $title_1=explode($title_var[0],$str);
  25. $title_2=explode($title_var[1],$title_1[1]);
  26. return $title_2[0];
  27. }else{
  28. preg_match_all($pat,$str,$res);
  29. return $res[1][0];
  30. }
  31. }
  32. function strip_s($str){
  33. $str = preg_replace ("/(\s+)/", ' ', $str);
  34. $str = str_replace(chr(13),'',$str);
  35. $str = str_replace(chr(10),'
    ',$str);
  36. $str = ltrim($str);
  37. $str = trim($str);
  38. return $str;
  39. }
  40. ?>
复制代码