文章详情

  • 游戏榜单
  • 软件榜单
关闭导航
热搜榜
热门下载
热门标签
php爱好者> php文档>关于编码的问题

关于编码的问题

时间:2010-09-16  来源:Blood

今天在CSDN看到一个帖子,是问如何判断url中的参数是utf-8还是gb2312的。

我记得好多年前我也遇到过这个问题。但是忘记具体是如何处理的了。。。

 

不过下面这段代码很棒。解决了具体的问题。

 

代码 using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Web;
using System.Text.RegularExpressions;

namespace ConsoleApplication2 {
    class Program {
        public static string DecodeURL2(String uriString) {
            if (Regex.IsMatch(
                HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("iso-8859-1")),
                @"^(?:[\x00-\x7f]|[\xe0-\xef][\x80-\xbf]{2})+$" // 如果不考虑哪些什么拉丁文啊,希腊文啊。。。乱七八糟的外文,用这个短的正则
            )) {
                return HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("UTF-8"));
            } else {
                return HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("GB2312"));
            }
        }

        public static string DecodeURL(String uriString) {
            if (Regex.IsMatch(
                HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("iso-8859-1")),
                @"^(?:[\x00-\x7f]|[\xfc-\xff][\x80-\xbf]{5}|[\xf8-\xfb][\x80-\xbf]{4}|[\xf0-\xf7][\x80-\xbf]{3}|[\xe0-\xef][\x80-\xbf]{2}|[\xc0-\xdf][\x80-\xbf])+$"
            )) {
                return HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("UTF-8"));
            } else {
                return HttpUtility.UrlDecode(uriString, Encoding.GetEncoding("GB2312"));
            }
        }

        public static void Main(string[] args) {
            Console.WriteLine("----------------------------------------------");
            Console.WriteLine(DecodeURL(".net%bc%bc%ca%f5"));
            Console.WriteLine(DecodeURL(".net%e6%8a%80%e6%9c%af"));


            Console.WriteLine("----------------------------------------------");
            Console.WriteLine(DecodeURL("%B8%A7%CB%B3%C7%E0%CB%C9%D2%A9%D2%B5"));
            Console.WriteLine(DecodeURL("%E6%8A%9A%E9%A1%BA%E9%9D%92%E6%9D%BE%E8%8D%AF%E4%B8%9A"));


            Console.WriteLine("------------------↓↓↓下面的出问题↓↓↓------------------");


            Console.WriteLine(DecodeURL("%E8%81%94%E9%80%9A")); // 正常
            Console.WriteLine(DecodeURL("%C1%AA%CD%A8")); // 发生编码误认
            // 编码误认,并没有好的解决方案,因为utf-8和gbk编码结果存在交叉,  我们都知道,记事本也都会出现这种情况

            Console.WriteLine("------------------↑↑↑上面的出问题↑↑↑------------------");


            Console.WriteLine(DecodeURL2("%E8%81%94%E9%80%9A")); // 正常
            Console.WriteLine(DecodeURL2("%C1%AA%CD%A8")); // 不会误认
            Console.WriteLine("----------------------------------------------");


            Console.ReadKey();
        }
    }
}


 

相关阅读 更多 +
排行榜 更多 +
辰域智控app

辰域智控app

系统工具 下载
网医联盟app

网医联盟app

运动健身 下载
汇丰汇选App

汇丰汇选App

金融理财 下载