當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

百度蜘蛛狀態(tài)碼與百度快照是否有關系

 2010-05-15 10:15  來源:   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

做網站有大半年了,今天第一次寫這類文章。至于為什么要寫這篇文章,是因為2009年下半年以來一直到現在,百度經常不正常,導致很多站長的網站出現快照不更新,快照回檔,甚至被K的現象。所以在A5論壇和seowhy論壇上經??吹接行┱鹃L說,希望百度能盡快更新自己的快照。其實快照第二天是否更新,不一定要寄希望于他人,只要自己查查web日志,就能知道。也就是我今天要跟大家說的話題。

下面我就簡單的談一下關于百度蜘蛛訪問網站后,web日志所返回的狀態(tài)碼與首頁的百度快照是否會更新之間的關系,所談到的都是小弟大半年以來每天觀察自己網站的web日志里百度蜘蛛的爬行痕跡所摸索出來的規(guī)律,希望對大家有些幫助。

大家可以嘗試著打開web日志的.log文件,web日志的默認路徑是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虛擬主機的朋友可以找空間商索要。打開文件夾下的.log文件,搜索百度蜘蛛,百度蜘蛛的名字為baiduspider。然后一直Enter,可以查出百度蜘蛛訪問網站后留下的所有足跡。在查找中,注意一下百度蜘蛛名字前面的IP,還有整行最后的狀態(tài)碼。

一般情況下,蜘蛛抓取網頁如果返回200 0 0代碼,則表示該網頁已經成功編入索引,200 0 64是指索引數據庫已經存在,沒有發(fā)現網頁有更新的內容,不需要重新索引的意思。304 0 0是指原來緩沖的文檔還可以繼續(xù)使用,跟200 0 64意思應該差不多吧。 (值得一提的是:200 0 64并不是網上很多人說的會被K站或降權,是正?,F象,動態(tài)網站抓取的時候大多數出現200 0 0,即便是網站沒有更新。)

在說一下蜘蛛IP,我的web日志里查到的蜘蛛IP一般都是220.181.7.*和123.125.66.*比較多,還有一個61.135.162.*,這三個段的IP是抓取網頁的,123.125.68.*這個段的是百度沙盒蜘蛛IP。61.135.168.*這個段的蜘蛛是抓取圖片的。不過百度蜘蛛應該還有很多,可能是按照網站的地區(qū)和線路發(fā)放蜘蛛的吧。具體情況還要具體對待。不過有一點可以肯定的是,在網站沒被降權的情況下,只要有兩個IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*這兩個段)都抓取了網站首頁且返回的狀態(tài)碼是200 0 0,那就不用每天等到零晨四點看百度更新首頁的快照了(我以前經常等到凌晨四五點才睡覺,呵呵,不過現在一般都是在早上六七點才更新快照)。

一般百度首頁快照比較慢、網站權重比較低或者被降權的網站,蜘蛛一般都是返回的200 0 64的狀態(tài)碼。我有一個被K過的網站,當時每天都只有123.125.68.*這個段的IP,且狀態(tài)碼都是返回的200 0 0。

本文由熱血傳奇* 站長原創(chuàng),首發(fā)于admin5,轉載請保留鏈接,謝謝!

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

熱門排行

信息推薦