对多次编码的字符串进行解码。
时间:2011-03-18 来源:56707801
在公司最近的项目中,碰到一些非常讨厌的问题,主要是因为以前公司对搜索关键字进行了二次编码,而服务器在回传参数的时候又没有进行相应的处理,导致某些参数在客户端和服务器端来回传递的时候,编码越来越乱。
于是在网上搜了很多关于编码方面的问题,收获很多,(可以参照这篇文章)就突发奇想想做一个能对多次进行了编码的字符串进行解码的方法,下面是大致编码:
/** * decode keyword * @param {String} value * @return {String} decoded value * */ decode: function (value) { /** * 针对escape、encodeURI、encodeURIComponent三种编码方式,根据其编码特征来处理 * * 1、escape,特征最为明显,对于值小与255的字符编码格式为%[a-zA-Z0-9]{2},对值大于255的字符编码格式为%u[a-zA-Z0-9]{4}, * escape不进行编码的字符有69个: *,+,-,.,/,@,_,0-9,a-z,A-Z * 2、encodeURI,编码格式为%[a-zA-Z0-9]{2}, * encodeURI不进行编码的字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z * 3、encodeURIComponent三种编码方式,编码格式为%[a-zA-Z0-9]{2}, * encodeURIComponent不进行编码的字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z * * 提取三种编码方式不同的部分: * 当字符的值小于255时,三种编码方式结果相同,可以任意使用一种解码方式 * 当字符的值大于255时,escape编码的结果与另外两者不同,可根据其编码特征来处理, * 即当编码格式为%u[a-zA-Z0-9]{4}时,使用unescape解码, * 当编码格式为%[a-zA-Z0-9]{2}时,因为encodeURIComponent不进行编码的字符少于encodeURI, * 则可判断decodeURIComponent可以同时针对encodeURI和因为encodeURIComponent两种编码方式进行解码 * * 记录解码结果,如果解码后与原字符串相同,则结束递归 */ var ov = value, nv; //if (/^((%u[a-zA-Z0-9]{4})|(%[a-zA-Z0-9]{2})|([\*\+-\./@_0-9a-zA-Z]*))*$/ig.test(ov)) nv = unescape(ov); if(/(%u[a-zA-Z0-9]{4}/ig.test(ov)) nv= unescape(ov); else if (/^((%[a-zA-Z0-9]{2})|([!#\$&'\(\)\*\+,-\./:;=\?@_~a-zA-Z0-9]))*$/ig.test(ov)) nv = decodeURIComponent(ov); else nv = ov; if (ov != nv) return this.decode(nv); else return nv; },
相关阅读 更多 +