如何正确处理 URL 的“大小写敏感”问题

在地址栏里输入 URL 时,会不会存在“大小写敏感”的问题?大多数人都不知道答案。简单说,这个问题是存在的。

以 Google 为例,输入 google.com 和 Google.com ,你得到的结果完全一样。但如果输入 www.google.com/intl/en/ads/ 和 www.google.com/Intl/en/ads 的话,那后一个网页就找不到了,虽然你只是把 i 变成了 I。

再举一个例子,以搜索引擎营销观察为例,输入 semwatch.orgSEMWatch.org,得到的结果是一样的。但如果模仿上面 Google 对 i 进行变化的例子,输入semwatch.org/?page_id=241 和 semwatch.org/?PAGE_ID=241,结果却又是一样的。

为什么会这样呢?

答案是,是网站主机所使用的操作系统的不同导致了 URL 的”大小写敏感“问题,Window 主机没有这个问题,而 Linux 主机则是要区分的。

domainname.com/page1 domainname.com/Page1
网站主机是 Window server
Http 协议头字段(Header response) 状态代码:200(正常) 状态代码:200(正常)
Google 的处理方法 两个 URL 都会被引索。显然,这会造成”重复内容“,不过 Google 一般会灵活处理,只选择一个。不过更重要的是,在这种情况下,有可能会造成一些链入和链出的 PR 传递上的损失。
网站主机是 Linux/Unix Server
Http 协议头字段(Header response) 状态代码:200(正常) 状态代码:404(无法到达)
Google 的处理方法 Google 会尝试进行引索,但最终会抛弃返回 404 的那个。在这种情况下,链入和链出的 PR 传递是肯定损失了。

好吧,我们如何来处理”大小写敏感“问题?

  • 大部分 SEO 的方法论都推荐只采用一个版本,我的建议是永远采用小写形式(因为这符合用户在绝大部分情况下的书写习惯)
  • 如果在某种情况下出现必须使用两个版本的情况,那一定要使用 301 重定向。

原载:Search Engine Journal,作者:Ann Smarty

转载请注明出处,欢迎大家留言或者来信(talk[at]SEMWatch.org) ,或者在 twitter 上 Follow SEMWATCH

标签: , ,

相关文章

tags: , ,
posted in 搜索引擎优化, 译文 by 无袍魔法师

Follow comments via the RSS Feed | 留下评论 | Trackback URL

6 Comments to "如何正确处理 URL 的“大小写敏感”问题"

  1. 小毛 wrote:

    嗯在处理一个大型B2B的时候 这个问题出现的很严重!

    [回复]

  2. tea6 wrote:

    恩,操作系统,看来semwatch还在Windows里

    [回复]

    luffy 回复:

    是写这篇东东的人在,其他作者未必是。:) @tea6,

    [回复]

  3. arya142 wrote:

    貌似Apache有个check spelling的MOD,nginx没有啊啊啊啊……郁闷……

    [回复]

  4. 深圳SEO wrote:

    学习了 应该值得重视

    [回复]

  5. 李冰 wrote:

    嗯,知其然还得知其所以然…受益

    [回复]

Leave Your Comment

 
Powered by Wordpress. Design by Bingo - The Web Design Experts.