快速业务通道

Linux下iconv转换字符集

作者 佚名技术 来源 Linux系统 浏览 发布时间 2012-04-05

在windows下编辑好了SQL执行脚本,但是传到linux上执行时报错,显示有不识别的字符.这需要进行字符集的转换.我一般是用iconv进行字符的边编码转换.但是这次执行时报出如下错误:iconv: 未知 2 处的非法输入序列

上网找到如下说明资料:

编码转换的时候,如果你的源格式设定为 GB2312 的话,在转换成 UTF-8 的时候,发现程序会报“illegal input sequence at position xxxx”的错误.这是你之前的做的假定有问题.GB2312 是国标里面一个最小也是最早的中文编码标准.其中,只涵盖了 6,763 个汉字.你需要转换的文件的原始的格式可能并不是 GB2312 编码.这个时候,你可以用 GB18030 做为源格式来进行转换.GB18030 是最新的国家标准,包含了 27,564 个汉字,向下兼容 GB2312 和 GBK.

假定的字符集指定,上述情况还可以在iconv中加入 -c 选项,忽略无效的字符,也可转换成功.

附iconv的用法:

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件.

用法:iconv [选项...] [文件...]

有如下选项可用:

输入/输出格式规范:

-f, --from-code=名称 原始文本编码

-t, --to-code=名称 输出编码

信息:

-l, --list 列举所有已知的字符集

输出控制:

-c 从输出中忽略无效的字符

-o, --output=FILE 输出文件

-s, --silent 关闭警告

--verbose 打印进度信息

--help 给出该系统求助列表

--usage 给出简要的用法信息

-V, --version 打印程序版本号

例子:

iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt

这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件.

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号