欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

php 编码转换-字符编码转换

程序员文章站 2022-04-06 15:20:02
...
提供一款大这在与flash效果时一个问题编码问题哦,下面我们提供N种php 编码转换和字符编码转换功能哦,好了费话不说多了喜欢就看看吧。

面的两段VB代码分别针对UTF-8(UTF8ENCODEURI)和GB2312(GBKENCODEURI)进行了编码的转换。

PRIVATE SUB COMMAND1_CLICK()
DEBUG.PRINT (UTF8ENCODEURI("汉字"))
DEBUG.PRINT (GBKENCODEURI("汉字"))
END SUB


FUNCTION UTF8ENCODEURI(SZINPUT)
DIM WCH, UCH, SZRET
DIM X
DIM NASC, NASC2, NASC3

IF SZINPUT = "" THEN
UTF8ENCODEURI = SZINPUT
EXIT FUNCTION
END IF

FOR X = 1 TO LEN(SZINPUT)
WCH = MID(SZINPUT, X, 1)
NASC = ASCW(WCH)

IF NASC < 0 THEN NASC = NASC + 65536

IF (NASC AND &HFF80) = 0 THEN
SZRET = SZRET & WCH
ELSE
IF (NASC AND &HF000) = 0 THEN
UCH = "%" & HEX(((NASC 2 ^ 6)) OR &HC0) & HEX(NASC AND &H3F OR &H80)
SZRET = SZRET & UCH
ELSE
UCH = "%" & HEX((NASC 2 ^ 12) OR &HE0) & "%" & _
HEX((NASC 2 ^ 6) AND &H3F OR &H80) & "%" & _
HEX(NASC AND &H3F OR &H80)
SZRET = SZRET & UCH
END IF
END IF
NEXT


iconv() 函数
Definition and Usage
定义和用法
iconv()函数的作用是:转换字符串的编码。

Description
string iconv ( string in_charset, string out_charset, string str )

Tips and Notes
注意点
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。

mb_convert_encoding() 函数
Definition and Usage
定义和用法
mb_convert_encoding()函数的作用是:转换字符串的编码。

Description
string mb_convert_encoding ( string str, string to-encoding [, mixed from-encoding])

注意:但是需要先enable mbstring 扩展库。
两者区别:mb_convert_encoding 中根据内容自动识别编码;mb_convert_encoding功能强大,但是执行效率比iconv差太多;

总结:一般情况下用 iconv,只有当遇到无法确定原编码是何种编码时才用 mb_convert_encoding 函数.

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
<?php
header("content-Type: text/html; charset=Utf-8");
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");
?>


2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成 utf-8 编码格式文件再测试
<?php
header("content-Type: text/html; charset=gb2312");
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");
?>


信源:fleaphp.net
mb_convert_encoding 函数为php内部多字节字符串编码转换函数,可以在有需要的使用场合(如:解决在GB2312编码环境下使用Ajax产生的中文字乱码的问题)方便进行编码转换,以解决网页乱码的问题,使用非常方便,效率非常高,
几乎支持所有编码。PHP 4 >= 4.0.6、PHP 5 版本支持。

函数原型: 引用:
/**
* 多字节字符串编码转换函数
*
* @param string str 需要进行编码转换的字符串
* @param string to_encoding 指定转换为某种编码,如:gb2312、gbk、utf-8等
* @param mixed from_encoding 混合指定原来字串的编码,如:同时指定 JIS, eucjp-win, sjis-win 混合编码
* @return string
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )使用举例:

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
<?php
header("content-Type: text/html; charset=Utf-8");
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");
?>

<?php header("content-Type: text/html; charset=Utf-8"); echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK"); ?>
2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成 utf-8 编码格式文件再测试
<?php
header("content-Type: text/html; charset=gb2312");
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");
?>

// 注意将此文件存盘成 utf-8 编码格式文件再测试 <?php header("content-Type: text/html; charset=gb2312"); echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8"); ?>
3、对整个页面进行转换
该方法适用所有编码环境。这样把前128个字符以外(显示字符)的字符集都用 NCR(Numeric character reference,如“汉字”将转换成“&#27721;&#23383;”这种形式)来表示,这样的编码在任意编码环境下页面都能正 常显示。

在php文件的头部加上下面三行代码: view plaincopy to clipboardprint?
mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');

mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码 mb_http_output("HTML-ENTITIES"); ob_start('mb_output_handler');
使用mb_convert_encoding 函数需启用PHP 的mbstring (multi-byte string)扩展。

查看php的信息页面,如果出现如下画面:
2008-10-16_111050.png (137.62 KB)
2008-10-16 12:01

则说明已启用mbstring (multi-byte string)扩展支持。

如果没有出现上面的画面,则需要做如下设置,让php支持该扩展。

1、windows 服务器环境

编辑 php.ini 文件,将; extension=php_mbstring.dll 前面的 ; 去掉,重启网页服务器。

2、Linux服务器环境

在编译配置时加入 --enable-mbstring=cn 编译参数,再进行PHP的编译安装。

以上就是php 编码转换-字符编码转换的内容,更多相关文章请关注PHP中文网(www.php.cn)!