前言:本篇文章主要講解的內(nèi)容為“網(wǎng)址規(guī)范化優(yōu)化”,什么是網(wǎng)址規(guī)范化?做SEO的朋友們應該都比較清楚,指的是搜索引擎挑選最合適的URL作為真正(規(guī)范化的)網(wǎng)址的過程。
那么,為什么要寫這么一篇文章呢?原因為:A5營銷平時在給客戶網(wǎng)站做SEO診斷的過程中,發(fā)現(xiàn)各種各樣的關于網(wǎng)址規(guī)范化的問題。由此可見,客戶對網(wǎng)址規(guī)范化這塊的知識點了解的非常少,甚至有的站長都不知道這個是什么。所以,為了讓更多站長學習到這塊的知識點,A5營銷SEO團隊寫個網(wǎng)址規(guī)范化全面大解析。如果各位站長覺得本篇文章對自身有幫助,還請不吝分享給其他站在學習!
一、首先,為什么會出現(xiàn)不規(guī)范網(wǎng)址?
如圖所示:
上面這幾個URL指的是同一個文件:首頁
從技術上來說,這幾個URL都是不同的網(wǎng)址,搜索引擎也確實把他當作不同的網(wǎng)址,雖然這些網(wǎng)址返回的都是相同的文件,也就是首頁。但從技術上來說:主機完全可以對這幾個網(wǎng)址返回不同的內(nèi)容。那么,除了圖上帶與不帶www造成的,以及結尾是否帶有index.html后綴造成的不規(guī)范網(wǎng)址外,其實還有以下幾種原因會造成。例如:
①:網(wǎng)站程序的原因,不少CMS系統(tǒng)經(jīng)常出現(xiàn)一篇文章可以通過幾種不同的URL去訪問。
②:URL靜態(tài)化設置存在錯誤,同一篇文章中有多個靜態(tài)化URL可以訪問。如圖(截圖URL和訪問的標題):
③:URL靜態(tài)化后,靜態(tài)和動態(tài)URL共存,都有鏈接,也都可以訪問。
④:網(wǎng)站的目錄后帶與不帶斜杠。如圖:
下圖為不同的網(wǎng)址,但其實是一個頁面。
⑤:加密網(wǎng)址。如圖:
下圖的URL同時存在,但都可以訪問。
⑥:URL中有端口號。如圖:
⑦:跟蹤代碼。有喜歡做網(wǎng)絡推廣的人,習慣在URL后面加跟蹤代碼。如圖:
二:其次,出現(xiàn)網(wǎng)址不規(guī)范會給網(wǎng)站帶來什么問題?
網(wǎng)站出現(xiàn)多個不規(guī)范網(wǎng)址會給搜索引擎收錄和排名帶來很多的麻煩,這個已經(jīng)是毋庸置疑的了。但是,還有不少站長對這個網(wǎng)址不規(guī)范不是很重。例如A5營銷在給意向客戶看網(wǎng)站時,發(fā)現(xiàn)不少網(wǎng)站的URL沒有做網(wǎng)址規(guī)范化。當問他們?yōu)槭裁床蛔鯱RL規(guī)范化?客戶回答:什么是網(wǎng)址規(guī)范化,怎么做,會寫在診斷建議方案上嗎?當場就醉了......還有一部分的SEO診斷(診斷詳情:)客戶,診斷的過程中發(fā)現(xiàn)網(wǎng)站的URL不規(guī)范問題很嚴重。這里,也希望這些部分站長能夠在看完本篇文章后學習到規(guī)范化知識點。我們接著閱讀.....
為什么不規(guī)范的URL會給搜索引擎和排名帶來很多麻煩?為了讓站長徹底的明白,我們舉個例子,比如:網(wǎng)站首頁是固定的且只有一個,但很多站長在鏈接回首頁的時候所使用的URL并不是唯一的,而是一會連到,一會連到。
一般來說,雖然不會給用戶造成什么麻煩,但因為這些網(wǎng)址都是同一個文件,會間接性的給搜索引擎造成困惑,搜索引擎會認為:到底哪一個網(wǎng)址才是真正的首頁?哪一個網(wǎng)址應該被當作首頁返回?那么,這里有個重點:如果網(wǎng)站上不同版本的網(wǎng)址同時出現(xiàn),就會很可能被搜索引擎收錄。被收錄之后,后果就可想而知了。而此時,搜索引擎在計算排名的時候必須要找到所謂規(guī)范化的網(wǎng)址,也就是搜索引擎認為的最合適的URL版本。
不規(guī)范化會造成的問題,A5營銷簡單的來說下:
①: 網(wǎng)站上有多個URL,這樣會分散頁面權重,不利于排名。
②:搜索引擎判斷的規(guī)范化網(wǎng)址并不是站長想要的那個網(wǎng)址。如圖(站長想要的是不帶后綴的,搜索引擎去把帶后綴的給收錄了):
③:如果網(wǎng)址規(guī)范化問題太嚴重,也可能影響收錄。因為:一個權重不是很高的域名,能收錄的總頁面數(shù)和蜘蛛總爬行時間是有限的,而搜索引擎把資源花在收錄不規(guī)范的網(wǎng)址上,留給獨特內(nèi)容的資源就變得越來越少了。
④:重復頁面過多,搜索引擎可能認為有作弊嫌疑。
⑤:對于搜索引擎來說,浪費資源、浪費寬帶。
三、最后,如何解決網(wǎng)址規(guī)范化的問題
關于如何解決網(wǎng)址規(guī)范化問題,可能這個對于站長而言是重點也是核心內(nèi)容了。那么,可以解決URL規(guī)范化問題的方法有很多,比如接下來我們要說的這些:
①:現(xiàn)在企業(yè)、個人站長用的程序最多的就是CMS,那么此時你就要確定你使用的這個CMS系統(tǒng)是否只能產(chǎn)生規(guī)范化網(wǎng)址,無論是否有靜態(tài)化,比如DEDE、帝國CMS等。
②:所有內(nèi)鏈要保持統(tǒng)一,都指向規(guī)范化網(wǎng)址。比如:以帶與不帶www為例子,確定一個版本為規(guī)范化網(wǎng)址后,網(wǎng)站的內(nèi)部鏈接都要統(tǒng)一使用這個版本,這樣搜索引擎就會明白哪一個是站長希望的網(wǎng)站規(guī)范化網(wǎng)址。而從用戶體驗的角度去看:用戶通常第一選擇就是帶www的版本為規(guī)范化網(wǎng)址。
③:301轉向。這個最常用也是最普遍的一個方法,站長可以通過301轉向把不規(guī)范化URL全部轉向到規(guī)范化URL。
④:canonical標簽。目前也是站長使用比較多的一種了,而且百度也是全面支持這個標簽了。
⑤:制作XML地圖,地圖中全部使用規(guī)范化網(wǎng)址,然后提交給搜索引擎。
雖然方法很多,但很多方法都有局限性,比如:有的網(wǎng)站因為技術的缺失或不成熟,導致301無法實現(xiàn)。再比如:很多CMS系統(tǒng)經(jīng)常無法受自己控制等等。那么,A5營銷這里主要針對301和canonical做下具體的說明,因為這兩種規(guī)范化方式是站長最常用的手段,而且也是百度最認同的。我們繼續(xù)閱讀.....
網(wǎng)址規(guī)范化 之 301轉向:
之前有寫了一篇301轉向全面大解析的文章,各位站長在閱讀本小段時,如果還想更詳細的了解301轉向,可以點擊地址:進入閱讀更多。那么,我們接著閱讀....
①:什么是301轉向?
301轉向又稱301重定向、301跳轉,是用戶或蜘蛛向網(wǎng)站服務器發(fā)出訪問請求時,服務器返回的HTTP數(shù)據(jù)流中頭信息部分狀態(tài)碼的一種,表示本網(wǎng)址永久性轉移到另一個地址。
另外,還有其他的網(wǎng)址轉向方法,例如:302轉向、javascript轉向、PHP/ASP/CGI程序轉向等。這里有個重點:除了301轉向外,其他的方法都是常用的作弊手法,雖然方法本身沒有對錯之分,但被作弊者用多了,搜索引擎對可疑的轉向都是非常敏感等。所以,其他的方法還是少用為妙。
②:301轉向傳遞權重
例如:網(wǎng)頁A用301重定向轉到網(wǎng)頁B,搜索引擎可以肯定網(wǎng)頁A永久性改變地址,或者說實際上不存在了,搜索引擎就會把網(wǎng)頁B當作唯一的有效目標。而且,更重要的是:網(wǎng)頁A積累的頁面權重將被傳遞到網(wǎng)頁B。
舉個例子:是選定的規(guī)范化網(wǎng)址,下面的幾個網(wǎng)址都做301轉向到選定的規(guī)范化網(wǎng)址上,這樣搜索引擎就知道它是規(guī)范化網(wǎng)址,而且會把這三個網(wǎng)址的權重都傳遞集中到規(guī)范化網(wǎng)址上。
可能有站長會問:301轉向多久可以生效?一般來說的話,在百度站長工具的改版工具上做下規(guī)則提交,大概一周左右就會生效。如圖:
③:怎么樣做301轉向?
關于怎么做301轉向,這里建議參考這篇文章:()本篇文章,有詳細的301轉向操作方法,完全適合個人站長和企業(yè)站長。由于文字太長,這里就不寫了。
網(wǎng)址規(guī)范化 之 canonical標簽(參考下百度站長平臺給出的標準):
①:canonical標簽有什么作用?
對一組內(nèi)容完全相同或高度相似的網(wǎng)頁,通過使用Canonical標簽可以告訴搜索引擎哪個頁面為規(guī)范的網(wǎng)頁,能夠規(guī)范網(wǎng)址并避免搜索結果中出現(xiàn)多個內(nèi)容相同或相似的頁面,幫助解決重復內(nèi)容的收錄問題,避免網(wǎng)站相同內(nèi)容網(wǎng)頁的重復展示及權重的分散,提升規(guī)范網(wǎng)頁的權重,優(yōu)化規(guī)范網(wǎng)頁的排名。
②:如何用canonical標簽指定規(guī)范網(wǎng)址?
可通過在每個非規(guī)范版本的 HTML 網(wǎng)頁的 部分中,添加一個 rel="canonical" 鏈接來進行指定規(guī)范網(wǎng)址。
例如,要指定指向網(wǎng)頁 的規(guī)范鏈接,需要按以下形式創(chuàng)建 元素:
然后將上述鏈接復制到某網(wǎng)頁所有非規(guī)范網(wǎng)頁版本的 部分中(例如 ),即可完成設置。
③:可設置規(guī)范網(wǎng)頁的幾種情況舉例:
舉例一、社區(qū)帖子可能由于置頂、突出顏色等行為導致內(nèi)容完全相同的一個網(wǎng)頁產(chǎn)生不同的鏈接,搜索引擎只會選擇其中一個鏈接建立索引,如以下兩個鏈接不同,內(nèi)容完全相同的頁面:
舉例二、對商品的列表頁面,按照價格或者優(yōu)惠等順序進行排序,但網(wǎng)頁內(nèi)容高度相似:
舉例三、網(wǎng)站有多個網(wǎng)頁展示的為相同型號的商品,只是每個網(wǎng)頁商品圖的顏色不同,其他內(nèi)容幾乎完全相似,此時也可設置rel="canonical",將當下最流行色彩的商品網(wǎng)頁設置規(guī)范網(wǎng)頁,推薦百度有優(yōu)先將其顯示在搜索結果中。
④:百度會完全遵守rel="canonical"標簽嗎?
網(wǎng)頁中添加該標簽后,就代表站長向百度推薦某個網(wǎng)頁作為最規(guī)范的網(wǎng)頁版本,百度會同時根據(jù)標簽的推薦及系統(tǒng)算法選擇出最合適的網(wǎng)頁將其顯示在搜索結果中。百度會根據(jù)網(wǎng)頁內(nèi)容實際情況考慮Canonical標簽中推薦的網(wǎng)頁,但不保證完全遵守該標簽。為了保證標簽的效果,請保證一個頁面中僅有一個Canonical標簽。
⑤:此鏈接是相對的還是絕對的?
rel="canonical" 可與相對鏈接或絕對鏈接一起使用,但建議您使用絕對鏈接,以最大程度地減少可能出現(xiàn)的混亂或問題。
⑥:rel="canonical"標簽可用于在不同的域名中建議規(guī)范網(wǎng)址嗎?
如果網(wǎng)站需要更換域名,且使用的服務器不能創(chuàng)建服務器端重定向網(wǎng)址的情況下,就可以使用rel="canonical" 鏈接元素指定希望百度收錄域的網(wǎng)址。
寫在最后:
以上由A5站長網(wǎng)SEO工程師黃忠原創(chuàng)編輯。關于網(wǎng)址規(guī)范化,本篇文章給出了最詳細的文字說明,希望個人和企業(yè)等站長在看完本篇文章后,能夠更多的掌握住網(wǎng)址規(guī)范化的知識點和操作方法。當然,如果您覺得本文幫助到您了,請不吝分享一下,將它傳播出去。A5站長網(wǎng)官方特色SEO診斷服務: 幫助網(wǎng)站突破瓶頸制約,助力企業(yè)成長!
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!