當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  網(wǎng)站運(yùn)營(yíng) >  正文

百度蜘蛛抓取不存在目錄 對(duì)應(yīng)的解決方法

 2020-11-17 11:17  來(lái)源: 代代SEO博客   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

相信大家在分析百度蜘蛛日志的時(shí)候經(jīng)常會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題,就是百度蜘蛛經(jīng)常會(huì)抓取一些不存在的目錄,比如:我網(wǎng)站沒(méi)有這些目錄,但是百度蜘蛛一直在抓取,或者你會(huì)發(fā)現(xiàn)百度蜘蛛在抓取自己的隱私目錄,或者說(shuō)php文件,這個(gè)是為什么哪?今天就為大家進(jìn)行詳細(xì)解析,講解對(duì)應(yīng)的解決辦法,本篇文章干貨較多,建議仔細(xì)閱讀。

1,如果蜘蛛只抓取首頁(yè),打死不抓取內(nèi)頁(yè),是什么情況!

很簡(jiǎn)單,域名有問(wèn)題,一般來(lái)講,如果遇到這種情況,域名目前可能在審核期,也就是說(shuō),做過(guò)違規(guī)行業(yè),或者你的程序有作弊的嫌疑,但是域名的占比較大,如果程序有問(wèn)題,開(kāi)始百度蜘蛛也會(huì)抓取一些的。

2,如果百度蜘蛛抓取一些隱私文件,例如php、zip、rar什么情況!

對(duì)于這種情況,你要去判斷當(dāng)前這個(gè)IP是不是假蜘蛛文件,因?yàn)楝F(xiàn)在很多IP會(huì)自動(dòng)更改自己的UA,跟百度蜘蛛一樣,你無(wú)法從蜘蛛日志中分辨,你可以去識(shí)別下IP,通過(guò)ip138看看是不是蜘蛛IP,如果不是,果斷屏蔽掉,如果太多,按照IP段進(jìn)行屏蔽。

3,如果百度蜘蛛抓取一些隱私目錄,真蜘蛛的情況下,怎么處理。

如果你確認(rèn)是真的百度蜘蛛,百度可能是在抓取你的頁(yè)面內(nèi)部程序,考察你用的程序的版本,等,這些百度都會(huì)有分辨策略的,一般來(lái)講,自己編寫(xiě)的程序,百度都會(huì)優(yōu)先給予高評(píng)分,是這樣的。我們?yōu)榱朔乐怪┲胱ト∥覀兊碾[私目錄,我們一般都會(huì)用robots.txt進(jìn)行屏蔽,記?。荷r(shí)間24小時(shí)左右。

4,如果蜘蛛抓取一些不存在的目錄,一些不存在的文件,怎么辦?

首先依然是判斷是否是真蜘蛛,如果是真蜘蛛,百度抓取一些不存在的目錄,是因?yàn)?,你這個(gè)域名之前做過(guò)一些站點(diǎn),現(xiàn)在又開(kāi)始做,百度會(huì)根據(jù)之前的評(píng)分、URL進(jìn)行抓取,看看是不是之前的站點(diǎn)又恢復(fù)了,一般來(lái)講,這種抓取會(huì)在30天內(nèi)自動(dòng)消失的,如果30天后一直存在,你就要屏蔽這類(lèi)鏈接了,總之:這種抓取對(duì)于你的站點(diǎn),沒(méi)有太大的傷害,只是排查而已。

另外還有一種情況,如果你把其他的站點(diǎn)301到你當(dāng)前的域名上,蜘蛛就會(huì)按照其他站點(diǎn)的URL來(lái)抓取你的網(wǎng)站,這個(gè)時(shí)候你也會(huì)發(fā)現(xiàn)百度在抓取一些不存在的目錄,不過(guò)不用怕,這種對(duì)于你的站點(diǎn)沒(méi)有傷害的。

5,蜘蛛抓取,301、304,、200、403、404、444狀態(tài)碼怎么辦?

首先我們要明白,301狀態(tài)碼,就是重定向,如果你的頂級(jí)域名,例如daidaiseo.com-》www.daidaiseo.com當(dāng)百度抓取daidaiseo.com上面的資源時(shí),就會(huì)出現(xiàn)301重定向的代碼,如果抓取www.daidaiseo.com上面的資源,就會(huì)是200狀態(tài)碼,意思是抓取成功。

而抓取304狀態(tài)碼是為什么那?如果你在日志上看到了304狀態(tài)碼,則表示,你的資源一直都沒(méi)有變化,屬于靜態(tài)頁(yè)面資源,304狀態(tài)碼,對(duì)于網(wǎng)站的影響比較小,一般來(lái)講是做了百度cdn,有緩存,就容易出現(xiàn)304狀態(tài)碼,但只要你每天給百度提交資源,時(shí)時(shí)保持更新,就沒(méi)事。

403是權(quán)限問(wèn)題,禁止訪問(wèn),是你服務(wù)器進(jìn)行了設(shè)置,而444則是未找到服務(wù)器,404則是空頁(yè)面,這個(gè)頁(yè)面丟失,這三個(gè)狀態(tài)碼,則表示網(wǎng)站出現(xiàn)問(wèn)題,記?。翰灰尵W(wǎng)站出現(xiàn)大量404,你可以讓狀態(tài)碼變成403只是限制訪問(wèn),如果都是404,則表明網(wǎng)站大量頁(yè)面不可用,百度評(píng)分就會(huì)降低,好了,今天就講解到這么多,后面會(huì)陸續(xù)分享這方面的知識(shí)點(diǎn)。

文章來(lái)源:代代SEO博客

來(lái)源地址:https://www.daidaiseo.com/seoti/10949.html

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度蜘蛛
蜘蛛抓取

相關(guān)文章

  • 提升網(wǎng)站圖片的優(yōu)化效果的幾種策略淺析

    雖然現(xiàn)在很多搞網(wǎng)站優(yōu)化的核心工作就是對(duì)網(wǎng)站首頁(yè)進(jìn)行優(yōu)化,認(rèn)為通過(guò)將首頁(yè)的權(quán)重提升,那么對(duì)于整個(gè)網(wǎng)站的曝光率和流量都會(huì)產(chǎn)生本質(zhì)的提升,一起來(lái)提升網(wǎng)站圖片的優(yōu)化效果的幾種策略淺析

  • 只需兩步,教你正確識(shí)別百度蜘蛛

    怎么才能識(shí)別正確的百度蜘蛛呢?來(lái)來(lái)來(lái),只需兩步,教你正確識(shí)別百度蜘蛛

    標(biāo)簽:
    百度蜘蛛
  • 搜索引擎蜘蛛抓取份額是什么?抓取份額是由什么決定的?

    搜索引擎蜘蛛抓取份額是什么?抓取份額是由什么決定的?怎樣節(jié)省抓取份額?對(duì)大中型網(wǎng)站來(lái)說(shuō),這是個(gè)頗為重要的SEO問(wèn)題,有時(shí)候會(huì)成為網(wǎng)站自然流量的瓶頸,今天我們就一一為大家介紹一下

    標(biāo)簽:
    蜘蛛抓取
    搜索引擎
  • 逆冬:一招教你識(shí)別百度真假蜘蛛!

    最近一個(gè)使用眾火的徒弟問(wèn)我、說(shuō)220和116的蜘蛛不是真蜘蛛,因?yàn)樗鹡slookup的時(shí)候,并沒(méi)有出現(xiàn)“baidu”類(lèi)的字樣、反而出現(xiàn)了別的字樣,所以他感覺(jué)不真,而同樣的ip,我本地用windows電腦nslookup的確實(shí)可以出現(xiàn)“baidu”類(lèi)的字樣,如下圖:

    標(biāo)簽:
    百度蜘蛛
  • 搜索引擎及搜索引擎蜘蛛是什么?

    很多新人SEO同學(xué)很少接觸到搜索引擎蜘蛛,即使百度蜘蛛也未必能接觸到。即使接觸到了,也不知道它是不是。為什么呢?因?yàn)楹芏郤EO新人沒(méi)有分析網(wǎng)站日志,所以沒(méi)看到。

    標(biāo)簽:
    搜索引擎
    百度蜘蛛

熱門(mén)排行

信息推薦