半个汉字变问号,求解决办法.
时间:2007-02-17 来源:PHP爱好者
一句话中截取一部分,则有可能会出现半个汉字,则显示为问号.
若全是汉字,则可截取偶数字节,但有可以有标点符号,空格之类的就不好办了,求解决办法.
77 回复于:2003-06-07 00:31:21 这个问题我以前也遇到过,不过最后采取了再加一个字段放摘要的办法 ,还是没解决啊
HonestQiao 回复于:2003-06-07 10:36:46 其实是有办法的,不过比较的笨啊。
思路如下:
1、确定截取长度 ln , 和中文字符标志 ck(ck=0)
2、从开头开始逐个读取字符,如果其ord>0xa0,那么设置ck++,读取直到ln
3、如果ck为奇数,那么读取ln+1或者ln-1个字符,否则读取ln个字符
wubai 回复于:2003-06-09 08:51:13 [quote:69ec4c1d43="snowall"]一句话中截取一部分,则有可能会出现半个汉字,则显示为问号.
若全是汉字,则可截取偶数字节,但有可以有标点符号,空格之类的就不好办了,求解决办法.[/quote:69ec4c1d43]
/**
* 截取中文部分字符串
*
* 截取指定字符串指定长度的函数,该函数可自动判定中英文,不会出现乱码
*
* @access public
* @param string $str 要处理的字符串
* @param int $strlen 要截取的长度默认为10
* @param string $other 是否要加上省略号,默认会加上
* @return string
*/
function showtitle($str,$strlen=10,$other=true) {
for($i=0;$i<$strlen;$i++)
if(ord(substr($str,$i,1))>0xa0) $j++;
if($j%2!=0) $strlen++;
$rstr=substr($str,0,$strlen);
if (strlen($str)>$strlen && $other) {$rstr.='...';}
return $rstr;
}
echomeng 回复于:2003-06-13 17:17:01 我也做了一个,用于显示文件名
$tmp_maxlen=22;
if (strlen($tmp_file)>$tmp_maxlen){
$i=0;
$ii=0;
while ($i<strlen($tmp_file)){
if (ord(substr($tmp_file,$i,1))>127){$ii++;}
if (($i>=$tmp_maxlen-3)&&($ii%2==0)){
$tmp_dispname=substr($tmp_file,0,$i-1).'...';
break;
}
$i++;
}
}else{$tmp_dispname=$tmp_file;}
信天翁 回复于:2003-06-14 00:47:06 [code:1:ae794a2b7e]function mycopy($string,$num)//截取汉字字符串
{
//2002-08-19
//注意:汉字第二位可能小于0xa0 !!
//如 朱镕基 镕字编码不规范;
if ($num>strlen($string)) $num=strlen($string);
$j=0;
for($i=0;$i<$num;$i++){
if(ord(substr($string,$i,1))>0xa0){
$j++;
if ($i<($num-1)){
$i++;
$j++;
}
}
}
if($j%2!=0) $num++;
$str=substr($string,0,$num);
return $str;
}[/code:1:ae794a2b7e]
pangty 回复于:2003-07-01 09:16:12 我的方法:
[code:1:94c98032c6]
// 截取汉字文本串并保持汉字完整
function mysubstr($str, $N) {
if (strlen($str) <= $N) return $str;
$i = 0;
$tmp = "";
while ($i <= $N) {
if (ord(substr($str,$i,1)) > 127) {
$tmp .= substr($str,$i,2);
$i = $i + 2;
} else {
$tmp .= substr($str,$i,1);
$i = $i + 1;
}
}
return $tmp;
}[/code:1:94c98032c6]
夜猫子 回复于:2003-07-01 17:31:53 哈哈!!!!
开始我也打算和你们一样解决的,最后我发觉有Multi-Byte String Functions。
http://www.php.net/manual/en/ref.mbstring.php
夜猫子 回复于:2003-07-01 18:03:52 [code:1:90dde3e5db]
<?php
$test = "这是1个用来测试的中文字符串";
echo mb_substr($test, 0, 6, "EUC-JP");
echo "<br><br>";
echo substr($test, 0, 6);
?>
[/code:1:90dde3e5db]
没有EUC-CN,只好EUC-JP了
redfox 回复于:2003-07-01 22:35:29 原来还有这好东东。
lenruobin 回复于:2003-07-02 14:25:47 Fatal error: Call to undefined function: mb_substr() in E:3.php on line 3
夜猫子 回复于:2003-07-02 17:24:57 编译的时候要加上:--enable-mbstring
巴豆 回复于:2003-10-29 16:43:09
php爱好者站 http://www.phpfans.net 网页制作|网站建设|数据采集.
若全是汉字,则可截取偶数字节,但有可以有标点符号,空格之类的就不好办了,求解决办法.
77 回复于:2003-06-07 00:31:21 这个问题我以前也遇到过,不过最后采取了再加一个字段放摘要的办法 ,还是没解决啊
HonestQiao 回复于:2003-06-07 10:36:46 其实是有办法的,不过比较的笨啊。
思路如下:
1、确定截取长度 ln , 和中文字符标志 ck(ck=0)
2、从开头开始逐个读取字符,如果其ord>0xa0,那么设置ck++,读取直到ln
3、如果ck为奇数,那么读取ln+1或者ln-1个字符,否则读取ln个字符
wubai 回复于:2003-06-09 08:51:13 [quote:69ec4c1d43="snowall"]一句话中截取一部分,则有可能会出现半个汉字,则显示为问号.
若全是汉字,则可截取偶数字节,但有可以有标点符号,空格之类的就不好办了,求解决办法.[/quote:69ec4c1d43]
/**
* 截取中文部分字符串
*
* 截取指定字符串指定长度的函数,该函数可自动判定中英文,不会出现乱码
*
* @access public
* @param string $str 要处理的字符串
* @param int $strlen 要截取的长度默认为10
* @param string $other 是否要加上省略号,默认会加上
* @return string
*/
function showtitle($str,$strlen=10,$other=true) {
for($i=0;$i<$strlen;$i++)
if(ord(substr($str,$i,1))>0xa0) $j++;
if($j%2!=0) $strlen++;
$rstr=substr($str,0,$strlen);
if (strlen($str)>$strlen && $other) {$rstr.='...';}
return $rstr;
}
echomeng 回复于:2003-06-13 17:17:01 我也做了一个,用于显示文件名
$tmp_maxlen=22;
if (strlen($tmp_file)>$tmp_maxlen){
$i=0;
$ii=0;
while ($i<strlen($tmp_file)){
if (ord(substr($tmp_file,$i,1))>127){$ii++;}
if (($i>=$tmp_maxlen-3)&&($ii%2==0)){
$tmp_dispname=substr($tmp_file,0,$i-1).'...';
break;
}
$i++;
}
}else{$tmp_dispname=$tmp_file;}
信天翁 回复于:2003-06-14 00:47:06 [code:1:ae794a2b7e]function mycopy($string,$num)//截取汉字字符串
{
//2002-08-19
//注意:汉字第二位可能小于0xa0 !!
//如 朱镕基 镕字编码不规范;
if ($num>strlen($string)) $num=strlen($string);
$j=0;
for($i=0;$i<$num;$i++){
if(ord(substr($string,$i,1))>0xa0){
$j++;
if ($i<($num-1)){
$i++;
$j++;
}
}
}
if($j%2!=0) $num++;
$str=substr($string,0,$num);
return $str;
}[/code:1:ae794a2b7e]
pangty 回复于:2003-07-01 09:16:12 我的方法:
[code:1:94c98032c6]
// 截取汉字文本串并保持汉字完整
function mysubstr($str, $N) {
if (strlen($str) <= $N) return $str;
$i = 0;
$tmp = "";
while ($i <= $N) {
if (ord(substr($str,$i,1)) > 127) {
$tmp .= substr($str,$i,2);
$i = $i + 2;
} else {
$tmp .= substr($str,$i,1);
$i = $i + 1;
}
}
return $tmp;
}[/code:1:94c98032c6]
夜猫子 回复于:2003-07-01 17:31:53 哈哈!!!!
开始我也打算和你们一样解决的,最后我发觉有Multi-Byte String Functions。
http://www.php.net/manual/en/ref.mbstring.php
夜猫子 回复于:2003-07-01 18:03:52 [code:1:90dde3e5db]
<?php
$test = "这是1个用来测试的中文字符串";
echo mb_substr($test, 0, 6, "EUC-JP");
echo "<br><br>";
echo substr($test, 0, 6);
?>
[/code:1:90dde3e5db]
没有EUC-CN,只好EUC-JP了
redfox 回复于:2003-07-01 22:35:29 原来还有这好东东。
lenruobin 回复于:2003-07-02 14:25:47 Fatal error: Call to undefined function: mb_substr() in E:3.php on line 3
夜猫子 回复于:2003-07-02 17:24:57 编译的时候要加上:--enable-mbstring
巴豆 回复于:2003-10-29 16:43:09
php爱好者站 http://www.phpfans.net 网页制作|网站建设|数据采集.
相关阅读 更多 +