Python 2.6 字符编码转换
时间:2010-10-17 来源:frouds
这两种类型的对象都是sequece序列,其中str是字节序列,而unicode是字符序列
decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。
# -*- coding:utf-8 -*- site="博客园" usite=unicode(site,"utf8")
因为这里源码的编码方式是utf8,且site的类型是str类型,即字节序列,所以我们将”博客园”从源码文件中按照utf-8读取成字节序列
然后使用unicode函数 将utf8编码的字符串site转化成unicode类型,从字节序列转化成字符序列
unicode(site,"utf8") 等同于 site.decode("utf8")
参考文章
http://lukejin.javaeye.com/blog/598303
http://wolfmaster.javaeye.com/blog/638029
相关阅读 更多 +