當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  建站經(jīng)驗(yàn) >  正文

百度網(wǎng)站抓取異常的原因有哪些 有什么影響和解決方法

 2020-09-26 09:49  來(lái)源: A5專(zhuān)欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

前言: 這是白楊SEO公眾號(hào)原創(chuàng)第 220 篇。經(jīng)常有朋友在我的SEO付費(fèi)交流群或者私下說(shuō),網(wǎng)站收錄怎么又下降了,百度好像抓取出問(wèn)題了,原因是什么怎么辦,所以今天就來(lái)分享下哈。

大綱如下:

1、抓取異常是什么?百度抓取異常又是什么?

2、百度抓取異常的原因有哪些?

3、網(wǎng)站抓取異常的原因有哪些?

4、百度抓取異常對(duì)網(wǎng)站有什么影響?

5、網(wǎng)站出現(xiàn)抓取異常的解決方法

抓取異常是什么?百度抓取異常又是什么?

所謂抓取異常,就是指搜索引擎蜘蛛無(wú)法抓取網(wǎng)站頁(yè)面,網(wǎng)站出現(xiàn)的抓取異常就是抓取異常,具體原因是什么下面會(huì)講到。

百度抓取異常是什么?簡(jiǎn)單理解就是百度的蜘蛛(baiduspider)無(wú)法正常抓取,就是百度抓取異常。如上圖,來(lái)源網(wǎng)上。9月3號(hào),百度蜘蛛來(lái)抓取時(shí),抓取時(shí)連接超時(shí)2次。

百度抓取異常的原因有哪些?

百度抓取異常的原原因主要分兩大類(lèi),一是網(wǎng)站異常,二是鏈接異常。在哪里看呢,在百度搜索資源平臺(tái)(https://ziyuan.baidu.com)你添加后數(shù)據(jù)統(tǒng)計(jì)—抓取異常那里,如下圖。

網(wǎng)站異常原因:

1、dns異常

當(dāng)百度蜘蛛(Baiduspider)無(wú)法解析您網(wǎng)站的IP時(shí),會(huì)出現(xiàn)DNS異常??赡苁悄?網(wǎng)站IP地址錯(cuò)誤 ,或者 域名服務(wù)商把Baiduspider封禁了 。

可以用WHOIS或者h(yuǎn)ost查詢(xún)自己網(wǎng)站IP地址是否正確而且可以解析,如果不正確或無(wú)法解析,與域名注冊(cè)商聯(lián)系,更新網(wǎng)站IP地址。

2、連接超時(shí)

抓取請(qǐng)求連接超時(shí),可能原因是: 服務(wù)器過(guò)載 或 網(wǎng)絡(luò)不穩(wěn)定。

3、抓取超時(shí)

抓取請(qǐng)求連接建立后,下載頁(yè)面速度 過(guò)慢 ,導(dǎo)致超時(shí)??赡茉蚍?wù)器過(guò)載, 帶寬不足 。

4、連接錯(cuò)誤

無(wú)法連接或者連接建立后對(duì)方服務(wù)器拒絕。

鏈接異常原因:

1、訪(fǎng)問(wèn)被拒絕

爬蟲(chóng)發(fā)起抓取,httpcode返回碼是403。

2、找不到頁(yè)面

爬蟲(chóng)發(fā)起抓取,httpcode返回碼是404。

3、服務(wù)器錯(cuò)誤

爬蟲(chóng)發(fā)起抓取,httpcode返回碼是5XX

4、其他錯(cuò)誤

爬蟲(chóng)發(fā)起抓取,httpcode返回碼是4XX,不包括403和404。

關(guān)于上面提到的403、404、4XX、5XX等,其實(shí)都是網(wǎng)站HTTP狀態(tài)碼,如果不清楚同學(xué),可以看這一篇: 白楊SEO:SEO入門(mén)學(xué)習(xí)之搜索引擎(百度)蜘蛛與網(wǎng)站HTTP狀態(tài)碼 ,再學(xué)習(xí)一下。

網(wǎng)站抓取異常的原因有哪些?

網(wǎng)站抓取異常的原因主要有以下五個(gè)方面:

1、服務(wù)器異常

服務(wù)器連接異常最大的可能是網(wǎng)站服務(wù)器過(guò)大,超負(fù)荷運(yùn)轉(zhuǎn),通過(guò)檢查瀏覽器輸入你的域名是否正常訪(fǎng)問(wèn)。服務(wù)器異常會(huì)導(dǎo)致蜘蛛無(wú)法連接網(wǎng)站服務(wù)器,導(dǎo)致出現(xiàn)抓取失敗。

2、域名過(guò)期

域名過(guò)期網(wǎng)站肯定不能訪(fǎng)問(wèn),域名解析就會(huì)失效了。如果存在這類(lèi)情況,你可以與你域名注冊(cè)商聯(lián)系解決,看是否被搶注,還是可以續(xù)費(fèi)回來(lái)。

3、網(wǎng)絡(luò)運(yùn)營(yíng)商異常

電信和聯(lián)通這兩種都是屬于網(wǎng)絡(luò)運(yùn)營(yíng)商,蜘蛛無(wú)法訪(fǎng)問(wèn)的網(wǎng)站。

如果是因?yàn)殡娦呕蚵?lián)通網(wǎng)絡(luò)運(yùn)營(yíng)商出現(xiàn)問(wèn)題,與網(wǎng)絡(luò)服務(wù)運(yùn)營(yíng)商聯(lián)系或者購(gòu)買(mǎi)CDN服務(wù)。

3、robots.txt文件設(shè)置問(wèn)題

robots.txt的功效主要是一些不重要的文件屏蔽掉告訴搜索引擎這些些頁(yè)面可以不抓取,但也可能會(huì)存在把重要的頁(yè)面也給屏蔽了,可以檢查下robots文件設(shè)置。

關(guān)于ROBOTS.TXT,可以看我之前寫(xiě)的這篇里面有寫(xiě)到:

白楊SEO:新人學(xué)習(xí)SEO常遇到的15個(gè)SEO術(shù)語(yǔ),建議收藏

4、死鏈接因素

原本正常的鏈接后來(lái)失效了就是死鏈接,死鏈接發(fā)送請(qǐng)求時(shí),服務(wù)器返回404錯(cuò)誤頁(yè)面。 死鏈的處理方案可以通過(guò)百度站長(zhǎng)平臺(tái)提交死鏈文件。

5、網(wǎng)站被掛馬

網(wǎng)站被掛馬,要查詢(xún)掛馬文件在哪里并刪除?;謴?fù)網(wǎng)站,更改登錄名和密碼,安全密保要從新設(shè)置,防止下次被掛馬。如果找不到,建議直接更換整個(gè)建站程序,換一個(gè)程序。

百度抓取異常對(duì)網(wǎng)站有什么影響?

如果網(wǎng)站上存在大量?jī)?nèi)容蜘蛛無(wú)法正常抓取,百度搜索引擎會(huì)認(rèn)為網(wǎng)站給用戶(hù)的體驗(yàn)上有缺陷( 訪(fǎng)問(wèn)網(wǎng)站的用戶(hù)沒(méi)有得到想要的東西,用戶(hù)的體驗(yàn)感就會(huì)下降 )降低對(duì)網(wǎng)站的評(píng)價(jià)。

而且,網(wǎng)站在 抓取、索引、權(quán)重 上都會(huì)受到一定程度的負(fù)面影響,更嚴(yán)重的會(huì)直接影響到網(wǎng)站從百度獲取的流量。 所以,百度網(wǎng)站抓取異常是非常嚴(yán)重的,一旦發(fā)現(xiàn),盡量解決。

如何解決呢,繼續(xù)往下看。

網(wǎng)站出現(xiàn)抓取異常的解決方法

1、出現(xiàn)5XX類(lèi)型錯(cuò)誤情況

出現(xiàn)這些情況,并不是網(wǎng)站本身向搜索引擎說(shuō)自己5XX問(wèn)題,有時(shí)打開(kāi)還是正常的,那么站長(zhǎng)后臺(tái)的為什么會(huì)顯示這個(gè)錯(cuò)誤呢?

如果出現(xiàn)此類(lèi)問(wèn)題百分百是因?yàn)槟愕木W(wǎng)站服務(wù)器造成,而對(duì)于某一個(gè)狀態(tài)碼的含義,比如503,直接交給技術(shù)來(lái)進(jìn)行解決。如果技術(shù)還是解決不了,那么建議更換一家服務(wù)器。

2、抓取出現(xiàn)DNS錯(cuò)誤情況

很多SEO新人發(fā)現(xiàn)網(wǎng)站打不開(kāi)了就會(huì)馬上找網(wǎng)站服務(wù)商,但是吧,域名DNS服務(wù)器有可能也會(huì)出現(xiàn)問(wèn)題。當(dāng)網(wǎng)站出現(xiàn)問(wèn)題后,比如打不開(kāi),第一時(shí)間應(yīng)當(dāng)確定到底是什么問(wèn)題?

如果是域名的DNS問(wèn)題,那么白楊SEO建議更換DSN。因?yàn)橛行〥SN出現(xiàn)了這個(gè)問(wèn)題,它后面還有可能出現(xiàn)。

如果要換,就要換大一點(diǎn)的DNS服務(wù)商,比如阿里云收購(gòu)的萬(wàn)網(wǎng)就不錯(cuò),畢竟大公司,穩(wěn)定性還可以的。

3、出現(xiàn)抓取超時(shí)問(wèn)題

現(xiàn)在做SEO排名已經(jīng)到了用戶(hù)為王時(shí)代,用戶(hù)如果不能在第一時(shí)間打開(kāi)你網(wǎng)站的頁(yè)面,那么就會(huì)跳到其他網(wǎng)站上去。而搜索引擎蜘蛛呢,一樣的。如果無(wú)法第一時(shí)間抓取,就會(huì)出現(xiàn)抓取超時(shí)問(wèn)題。

上面說(shuō)過(guò),這個(gè)抓取超時(shí),大多都是因?yàn)閹挷蛔?,或者是網(wǎng)站頁(yè)面太大而引發(fā)的所以解決方法建議如下:

(1)、在不影響圖片質(zhì)量的情況下,對(duì)大的圖片進(jìn)行壓縮哈;

(2)、減少比如網(wǎng)站的JS腳本文件類(lèi)型的使用,或者把一些JS進(jìn)行合并;跟技術(shù)說(shuō)清楚。

(3)、整個(gè)網(wǎng)站頁(yè)面長(zhǎng)度進(jìn)行控制,尤其是你的網(wǎng)站首頁(yè)。很多人網(wǎng)站首頁(yè)做了十來(lái)屏,一般用戶(hù)最多下拉三到五屏。越長(zhǎng),整個(gè)加載就會(huì)越久。

(4)、網(wǎng)頁(yè)的內(nèi)鏈數(shù)量,一般一個(gè)頁(yè)面互相之間的內(nèi)鏈數(shù)量建議不要超過(guò)500條哦,其實(shí)越多,蜘蛛都會(huì)去往下爬取,小網(wǎng)站基本沒(méi)這個(gè)問(wèn)題。

總之,百度抓取網(wǎng)站異常這個(gè)問(wèn)題,建議建站時(shí)找成熟的程序建站,同時(shí),找像阿里云這樣的大的服務(wù)商。不要總想著省錢(qián),淘寶隨便幾百建個(gè)站,找個(gè)不知名服務(wù)商,其實(shí)這樣得不嘗失的。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度seo
百度網(wǎng)站優(yōu)化

相關(guān)文章

  • 最接地氣的SEO指南 讓新入行的你少走一大段彎路

    老賀是2005年開(kāi)始做網(wǎng)站的,那時(shí)候我們國(guó)內(nèi)的網(wǎng)站并不多,但是每天分享知識(shí)的人卻不少,整天混跡在A5站長(zhǎng)網(wǎng)、站長(zhǎng)之家、落伍者上面,不斷的充實(shí)自己,不過(guò)信息良莠不齊,也走了很多的彎路。之后在實(shí)踐、實(shí)戰(zhàn)中有了技能,在2008年的時(shí)候,老賀開(kāi)始對(duì)外搞SEO,就這樣一晃十多年過(guò)去了。今天這篇文章,老賀只寫(xiě)一

  • 百度會(huì)區(qū)別對(duì)待不同域名前后綴嗎?

    我曾在另一個(gè)SEO博客中發(fā)表過(guò)一篇文章,是關(guān)于“百度是否會(huì)區(qū)別對(duì)待不同域名后綴”的文章,在文章中我提出了一個(gè)觀點(diǎn),明確指出“百度不會(huì)區(qū)別對(duì)待不同后綴的域名”,每一種后綴的域名享有同等待遇。

    標(biāo)簽:
    百度seo
  • 談?wù)勅W(wǎng)SEO矩陣是什么?一般怎么做?【舉例】

    大家好,我是白楊SEO,專(zhuān)注SEO十年,SEO流量實(shí)戰(zhàn)派,企業(yè)流量增長(zhǎng)顧問(wèn)。擅長(zhǎng)研究各平臺(tái)自然搜索流量玩法。曾帶一個(gè)PCB項(xiàng)目,從0-1,現(xiàn)該項(xiàng)目年?duì)I收10億+。曾靠一篇文章引流精準(zhǔn)粉絲1000+,變現(xiàn)3萬(wàn)+。個(gè)人原創(chuàng)公眾號(hào):白楊SEO。一年不到,關(guān)注人數(shù)從0到5000+,目前關(guān)注25000+。

  • 百度正在暴力截流SEO還有用嗎

    百度的核心流量階層基本已經(jīng)固化,新的站點(diǎn)很難會(huì)有太多的流動(dòng)機(jī)會(huì),這個(gè)時(shí)候就需要去豐富流量的來(lái)源類(lèi)型,避免把雞蛋都裝在一個(gè)籃子里。比如下面這個(gè)站點(diǎn),谷歌和必應(yīng)的流量占比都在不斷的上漲中,這也是平臺(tái)向內(nèi)容生產(chǎn)者釋放出的友好信號(hào),是值得去重點(diǎn)拓展維護(hù)的。

    標(biāo)簽:
    百度seo
  • 怎么巧用百科讓網(wǎng)站排名上升流量倍增?

    怎么巧用百科讓網(wǎng)站排名上升流量倍增?很多朋友的網(wǎng)站優(yōu)化以后還是沒(méi)有得到很好的排名,沒(méi)關(guān)系,今天給大家分享一個(gè)技巧,就是使用百科讓沒(méi)排名的網(wǎng)站迅速排名,需要的朋友可以參考下

    標(biāo)簽:
    網(wǎng)站流量
    百度seo

熱門(mén)排行

信息推薦