搜索引擎抓取頁面,不是和人一樣,從網(wǎng)頁上去看頁面,而是從這個頁面的代碼去看!鼠標右鍵,查看源文件,我們就可以看到改網(wǎng)頁的HTML代碼,這就是蜘蛛要讀取的內(nèi)容,從開始讀取到最后。也有人說,是從頁面的上到下,左到右的讀取的,我覺得更科學的講應該是從HTML代碼的前面一直讀取到最后!
為什么要精簡代碼?
蜘蛛是讀取代碼從上面到下面,如果你有很多的和正文無關的代碼,蜘蛛首先要讀取,蜘蛛能力有限,可能還沒有讀到正文,就已經(jīng)累的離開了,就這樣的情況,更談不上排名了,你必須知道蜘蛛能力有限,我們不要為難蜘蛛,用最精簡的代碼,讓正文及早體現(xiàn)出來,讓蜘蛛成功抓取。
如何精簡代碼?
1)精簡代碼一般來說,我們的頁面采用DIV+CSS,很多人說用DIV+CSS有利于SEO,這句話我贊同,但是用了DIV比TABLE排名一定好,這是無稽之談!因為用DIV+CSS的最重要的是精簡代碼,有利于搜索引擎抓取!
2)無關代碼的外置
比如我們的CSS代碼,應該采用CSS外置,以及一些廣告代碼,特效代碼都采用JS外置! 在網(wǎng)頁代碼里調(diào)用就可以了,這就大大精簡了網(wǎng)頁代碼。
3)內(nèi)頁的頭部信息
在網(wǎng)站的內(nèi)頁,比如文章頁面,頻道頁面,其實頭部信息(LOGO,頂部廣告,頂部搜索框),這些對于這個文章頁面來說都是無關信息,都可以調(diào)用出去,讓你的正文在代碼里更加靠前。當然你要保證基本的導航,比如返回首頁,各個欄目的鏈接,以及最新文章、相關文章,熱門文章等內(nèi)部鏈接都要保障,但是我覺得這些代碼要在正文下面,文章頁面首先體現(xiàn)的應該是文章的標題,內(nèi)容。。其次才是這些相關的鏈接信息。這樣就大大精簡了網(wǎng)站的代碼,有利于內(nèi)頁在長尾關鍵字的競爭!
4)程序自身產(chǎn)生的冗余代碼
尤其是.NET編寫的程序,會自動很多冗余的垃圾代碼,這些代碼不僅僅大大降低的網(wǎng)頁的速度,也同樣被讓蜘蛛累到趴下,蜘蛛是模擬人的行為的,曾經(jīng)在我們公司的網(wǎng)站就曾經(jīng)出現(xiàn)過,程序員編寫的.NET,導致網(wǎng)頁產(chǎn)生大量的冗余代碼,當時一個馬虎沒有留意,后來導致這一批頁面不僅速度拖慢,之后被百度在搜索引擎全部刪除,因為大量的冗余代碼,讓這一批網(wǎng)頁出現(xiàn)了頁面相似度的問題,而導致百度刪除結(jié)果,之后馬上解決了。所以這些問題我們一定要非常非常的注意!
先總結(jié)這4點,總而言之,言而總之,我們的網(wǎng)頁代碼要十分精簡,無關內(nèi)容外置,網(wǎng)頁主體內(nèi)容提前,相關內(nèi)容滯后,要了解每張網(wǎng)頁的使命。比如對于文章頁面來說,上面的LOGO等頂部信息就是多余代碼,應該外置只要參考這個原則去精簡代碼就可以。
作者: 戴仁光@黑色幽默
博客地址:
本文地址:
版權所有 轉(zhuǎn)載時必須以鏈接形式注明作者和原始出處及本聲明。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!