修改ubuntu字符集,导致网页抓取乱码
时间:2006-11-29 来源:stone5
修改ubuntu字符集,导致网页抓取乱码
昨天修改了ubuntu的字符集为zh_utf8,不想今天的部分网页抓取就出错了。原来抓取来的网页都是gb2312,在执行网页抓取及处理的shell代码中出错了。故就在SHELL脚本中增加一句:
iconv -f gb2312 -t utf8 |
问题解决。
相关阅读 更多 +