快速业务通道

Step1数据系统技术(6.汉字URL路径的处理和编码)

作者 佚名技术 来源 NET编程 浏览 发布时间 2012-05-21

其实我挺不想写这一章的,因为直到现在,我还经常为编码的事情弄得云里雾里,不过考虑到我在之前的这个文章系列的目录里面已经列出了这个主题,如果不写有欺骗的嫌疑,想想还是写吧,反正没有谁把我当作一个权威的。

编码问题向来很复杂,我却不愿意向复杂了讲,我只从比较常见的讲。

编码,实际上是一个字符串的表达方式,通常从URL编码来讲,我们最常见到的编码有两种:第一种是GB2312编码,这是百度搜索使用的一种编码形式,例如你在百度搜索一个"你好",你会看到搜索结果网址是http://www.baidu.com/s?wd=%C4%E3%BA%C3,其中的蓝色部分就是“你好”的GB2312编码后的URL形式;第二种是UTF-8编码,例如我们在Google搜索"你好",搜索结果的网址是http://www.google.cn/search?hl=zh-CN&q=%E4%BD%A0%E5%A5%BD&meta=&aq=f,其中的蓝色部分是“你好”的UTF-8编码后的URL形式,想查询一个汉字的编码,可以使用这个方法来快捷查询。

使用什么编码可能很多时候我们并不在意,用什么编码都应该问题不大,可是当我们要对中文的内容进行URL重写的时候,可能就要注意这一点了,大家都知道,URL之中直接使用中文会对搜索引擎理解你的页面内容有很大的帮助,这个时候使用哪种编码是需要考虑的内容。

我个人建议使用GB2312编码,这其实是一个无赖的选择,我的网站原先是使用utf-8编码的,可是后来我发现,baidu检索我的页面的robot好像有问题,似乎是不支持还是怎么的,用一些不知道是什么编码的路径来访问我的服务器,结果都显示为404,让我很郁闷,后来我就改成gb2312了,有时候你就会遇到这样的问题,必须特殊照顾那些技术有缺陷的角色。

最终我得到的效果就是,我的地名信息系统在baidu的显示结果之中会直接显示为汉字,例如大家访问http://www.baidu.com/s?wd=%D1%EE%E8%CF%B4%E5,可以看到效果(不过这个对SEO有没有好处不好说),不过因为使用了这个gb2312,所以在Google下就显示不出这个了。

这一篇文章我也不知道讲了一些什么,不过反正我也不打算在编码问题上讲多少,一想到编码,我就有一些头疼。

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号