現(xiàn)在互聯(lián)網(wǎng)越來越講究規(guī)范化,網(wǎng)站的URL標準化(URL canonicalization)是近兩年來在各大搜索引擎的搜索結(jié)果中出現(xiàn)的一個很大的問題。它指的是搜索引擎挑選最好的URL網(wǎng)址作為真正網(wǎng)址的過程。
我們先看一下下面幾個URL:
通常來說這幾個URL一般來說指的是同一個文件或網(wǎng)頁,但是從技術(shù)上來講,這幾個URL網(wǎng)址都是不同的。雖然在絕大部分情況下,這些網(wǎng)址所返回的都是相同的文件,也就是你的主頁。但是從技術(shù)上來說,主機完全可以對這幾個網(wǎng)址返回不同的內(nèi)容。
當(dāng)搜索引擎要規(guī)范化網(wǎng)址時,搜索引擎需要從這些選擇當(dāng)中挑一個最好的代表。一般來說,你的主頁應(yīng)該是固定的,只有一個。但是有的時候,在很多網(wǎng)站上站長在鏈接回主頁時,所使用的URL并不是唯一的。比如很可能在你的網(wǎng)站上,一會連到URL ,一會兒連到URL 。
這些網(wǎng)址都是同一個文件,顯然給訪客不會造成什么麻煩,但是對搜索引擎來說卻是給它造成了困惑,哪一個網(wǎng)址是你真正的主頁呢?如果在你的網(wǎng)站上,不同的版本網(wǎng)址都大量出現(xiàn),那么這兩個URL可能都會被搜索引擎收錄進數(shù)據(jù)庫,這時就會造成復(fù)制內(nèi)容網(wǎng)頁。
所謂復(fù)制內(nèi)容網(wǎng)頁,指的是兩個或多個網(wǎng)頁的內(nèi)容是相同或大部分相似的。很多時候,復(fù)制網(wǎng)頁有可能是作弊手段。就算不是作弊手段的時候,搜索引擎通常也只會挑出其中一個返回搜索結(jié)果,而把其他的復(fù)制網(wǎng)頁都排在最后面,以至于根本找不到。
當(dāng)你的網(wǎng)站出現(xiàn)網(wǎng)址URL規(guī)范化問題的時候,就有可能造成被懷疑為復(fù)制網(wǎng)頁,因而影響搜索引擎結(jié)果排名。
我們可能通過以下三種方法制定網(wǎng)站的URL標準化:
1)你的網(wǎng)站內(nèi)部在鏈接到其他網(wǎng)頁,尤其是主頁時,只使用一種URL。不管是包含www或不包含www,你要由始至終只使用一個版本。這樣搜索引擎也就明白哪一個是規(guī)范化的主頁網(wǎng)址。
2)使用301重定向,在你的主機服務(wù)器上,把所有有可能成為主頁網(wǎng)址的URL,到你所選擇的主頁網(wǎng)址版本。
3) 使用基準標簽base 在網(wǎng)頁的head區(qū)加上
當(dāng)然,除了包含www和不包含www的兩個版本以外,還有其他類型的URL規(guī)范化問題。比如有的時候,搜索引擎會去掉或加上網(wǎng)址尾端最后的斜線。有的時候會嘗試把大寫字母換成小寫字母,有的時候可能嘗試去掉會話ID(session ID)等等,這些都有可能造成網(wǎng)址規(guī)范化問題。
SEO專題推薦:
關(guān)鍵詞優(yōu)化專題:網(wǎng)站關(guān)鍵詞優(yōu)化沒效果?來這里學(xué)習(xí)最實用的關(guān)鍵詞優(yōu)化技巧!
內(nèi)鏈優(yōu)化專題:最能提升網(wǎng)站權(quán)重的內(nèi)鏈部署優(yōu)化技巧與方法
外鏈建設(shè)專題:高質(zhì)量自然外鏈怎么做?讀完這些你將質(zhì)的飛躍
網(wǎng)站降權(quán)專題:2015年最有用的網(wǎng)站降權(quán)、被K、被黑、被攻擊的解決方法
用戶體驗專題:學(xué)習(xí)完這些,作為站長的你可以秒懂如何做網(wǎng)站用戶體驗
行業(yè)網(wǎng)站專題:優(yōu)化行業(yè)網(wǎng)站的“葵花寶典”看完后無優(yōu)化壓力
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!