欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

php 获取中文字符串首字母

程序员文章站 2023-12-30 09:03:22
...
碰到一个中文字符串排序的问题,要用到获取中文的第一个字母,程序可以获取任意字符串的首字母.
原理就是根据gb2312编码是按拼音排序.不熟悉gb2312的可以看下编码方式.
来源: http://www.phpman.cn
  1. $limit=array( //gb2312 拼音排序
  2. array(45217,45252), //A
  3. array(45253,45760), //B
  4. array(45761,46317), //C
  5. array(46318,46825), //D
  6. array(46826,47009), //E
  7. array(47010,47296), //F
  8. array(47297,47613), //G
  9. array(47614,48118), //H
  10. array(0,0), //I
  11. array(48119,49061), //J
  12. array(49062,49323), //K
  13. array(49324,49895), //L
  14. array(49896,50370), //M
  15. array(50371,50613), //N
  16. array(50614,50621), //O
  17. array(50622,50905), //P
  18. array(50906,51386), //Q
  19. array(51387,51445), //R
  20. array(51446,52217), //S
  21. array(52218,52697), //T
  22. array(0,0), //U
  23. array(0,0), //V
  24. array(52698,52979), //W
  25. array(52980,53688), //X
  26. array(53689,54480), //Y
  27. array(54481,55289), //Z
  28. );
  29. $str="A:这是一个测试程序1";
  30. $str= iconv("UTF-8","gb2312", $str);
  31. echo $str."";
  32. $i=0;
  33. while($i $tmp=bin2hex(substr($str,$i,1));
  34. if($tmp>='B0'){ //汉字的开始
  35. $t=getLetter(hexdec(bin2hex(substr($str,$i,2))));
  36. printf("%c",$t==-1 ? '*' : $t );
  37. $i+=2;
  38. }
  39. else{
  40. printf("%s",substr($str,$i,1));
  41. $i++;
  42. }
  43. }
  44. function getLetter($num){
  45. global $limit;
  46. $char_index=65;
  47. foreach($limit as $k=>$v){
  48. if($num>=$v[0] && $num $char_index+=$k;
  49. return $char_index;
  50. }
  51. }
  52. return -1;
  53. }
  54. ?>
复制代码

上一篇:

下一篇: