PHP 中文处理技巧
程序员文章站
2022-04-08 23:34:06
折腾了一天的时间,才弄出点眉目来。 做ajax应用或flash应用,提交中文内容到后台,涉及到编码解码(encode、decode)及编码格式的转换。 网上的php端esc...
折腾了一天的时间,才弄出点眉目来。
做ajax应用或flash应用,提交中文内容到后台,涉及到编码解码(encode、decode)及编码格式的转换。
网上的php端escape unescape函数建议不要用,它把中英文混合时的英文过滤掉了,我是莫名其妙了n久啊,建议用unicode_urldecode这个。
再就是编码格式的转换,这主要涉及数据的存储和客户端返回,用iconv就搞定,这个函数似乎是从c++中借鉴来的。
function unicode_urldecode($url)
{
preg_match_all('/%u([[:alnum:]]{4})/', $url, $a);
foreach ($a[1] as $uniord)
{
$dec = hexdec($uniord);
$utf = '';
if ($dec < 128)
{
$utf = chr($dec);
}
else if ($dec < 2048)
{
$utf = chr(192 + (($dec - ($dec % 64)) / 64));
$utf .= chr(128 + ($dec % 64));
}
else
{
$utf = chr(224 + (($dec - ($dec % 4096)) / 4096));
$utf .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
$utf .= chr(128 + ($dec % 64));
}
$url = str_replace('%u'.$uniord, $utf, $url);
}
return urldecode($url);
}
做ajax应用或flash应用,提交中文内容到后台,涉及到编码解码(encode、decode)及编码格式的转换。
网上的php端escape unescape函数建议不要用,它把中英文混合时的英文过滤掉了,我是莫名其妙了n久啊,建议用unicode_urldecode这个。
再就是编码格式的转换,这主要涉及数据的存储和客户端返回,用iconv就搞定,这个函数似乎是从c++中借鉴来的。
复制代码 代码如下:
function unicode_urldecode($url)
{
preg_match_all('/%u([[:alnum:]]{4})/', $url, $a);
foreach ($a[1] as $uniord)
{
$dec = hexdec($uniord);
$utf = '';
if ($dec < 128)
{
$utf = chr($dec);
}
else if ($dec < 2048)
{
$utf = chr(192 + (($dec - ($dec % 64)) / 64));
$utf .= chr(128 + ($dec % 64));
}
else
{
$utf = chr(224 + (($dec - ($dec % 4096)) / 4096));
$utf .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
$utf .= chr(128 + ($dec % 64));
}
$url = str_replace('%u'.$uniord, $utf, $url);
}
return urldecode($url);
}
上一篇: 说我是gay
下一篇: 为查询结果建立向后/向前按钮