當(dāng)前位置:首頁 >  站長(zhǎng) >  搜索優(yōu)化 >  正文

怎么識(shí)別百度蜘蛛Baiduspider的真假呢?官方推薦方法

 2020-09-17 17:26  來源: 黎青松SEO博客   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

實(shí)際上,我們的日志中,有很多的baiduspider是他人偽裝的,要想解決這個(gè)問題。我們必須在驗(yàn)證baiduspider真?zhèn)紊舷鹿Ψ?,這篇文章詳細(xì)的介紹了爬蟲的鑒別方法。

我們?cè)诟鶕?jù)網(wǎng)站日志分析搜索引擎蜘蛛抓取網(wǎng)頁的記錄時(shí),實(shí)際上很多站點(diǎn)都是有一些偽裝稱baiduspider的到訪者的。這些數(shù)據(jù)會(huì)嚴(yán)重影響我們對(duì)日志分析后的判斷。

這些到訪者,為什么會(huì)偽裝為baiduspider來訪問我們的網(wǎng)站呢?最典型的就是采集你內(nèi)容的那些人。他們知道很多工具是能夠看到哪些ip訪問網(wǎng)站的量過大的。例如某一個(gè)ip今天訪問你網(wǎng)站1萬次,那正常嗎?肯定是不正常的。但他要是baiduspdier呢?呵呵,那就正常了。

Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)AppleWebKit/534.46(KHTML,likeGecko)Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

如上是包含了百度的常規(guī)爬蟲,和渲染爬蟲render的。這兩個(gè)爬蟲的區(qū)別符已經(jīng)用紅色字體標(biāo)出來了。

可以通過DNS反查方式來解決這個(gè)問題。根據(jù)平臺(tái)不同驗(yàn)證方法不同,如linux/windows/os三種平臺(tái)下的驗(yàn)證方法分別如下:

1、在linux平臺(tái)下,您可以使用hostip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

2、在windows平臺(tái)或者IBMOS/2平臺(tái)下,您可以使用nslookupip命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

3、在macos平臺(tái)下,您可以使用dig命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

以上就是成都SEO教程自學(xué)網(wǎng)傲遠(yuǎn)對(duì)怎么識(shí)別百度蜘蛛Baiduspider的真假的介紹,希望可以幫到你!如有疑問,歡迎留言!

文章出處:黎青松SEO博客

原文地址: http://www.alitaohuo.com/SEObaike/SEOrumenjiaocheng/2005.html

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
搜索引擎蜘蛛
百度蜘蛛
baidu

相關(guān)文章

  • 什么是搜索引擎蜘蛛?SEO搜索引擎蜘蛛工作原理

    作為一名編輯乃至站長(zhǎng),在關(guān)注網(wǎng)站在搜索引擎排名的時(shí)候,最重要的就是蜘蛛(spider)。搜索引擎蜘蛛是一個(gè)自動(dòng)抓取互聯(lián)網(wǎng)上網(wǎng)頁內(nèi)容的程序,每個(gè)搜索引擎都有自己的蜘蛛,那么,蜘蛛是怎樣在網(wǎng)站上抓取內(nèi)容的呢?一起來看看它的工作原理吧

    標(biāo)簽:
    搜索引擎蜘蛛
  • 什么是搜索引擎蜘蛛?SEO搜索引擎蜘蛛工作原理

    作為一名編輯乃至站長(zhǎng),在關(guān)注網(wǎng)站在搜索引擎排名的時(shí)候,最重要的就是蜘蛛(spider)。搜索引擎蜘蛛是一個(gè)自動(dòng)抓取互聯(lián)網(wǎng)上網(wǎng)頁內(nèi)容的程序,每個(gè)搜索引擎都有自己的蜘蛛,那么,蜘蛛是怎樣在網(wǎng)站上抓取內(nèi)容的呢?一起來看看它的工作原理吧

    標(biāo)簽:
    搜索引擎蜘蛛
  • 七類蜘蛛陷坑 網(wǎng)站優(yōu)化中必須要躲避

    不少的網(wǎng)站就是沒有優(yōu)化好這一方面造成了站內(nèi)存在很多蛛蛛陷坑,到最終壓根兒一個(gè)好好的網(wǎng)站被搜索引擎網(wǎng)站屢屢錯(cuò)判,要不是不給名次,甚至于是造成了數(shù)量多頁面都搜索引擎網(wǎng)站拋棄。下面小編就為大家介紹網(wǎng)站優(yōu)化中必須要躲避的七類蛛蛛陷坑

    標(biāo)簽:
    搜索引擎
    搜索引擎蜘蛛
  • 網(wǎng)站怎么做seo才能吸引蜘蛛收錄更多的頁面?

    網(wǎng)站怎么做seo才能吸引蜘蛛收錄更多的頁面?蜘蛛爬行的次數(shù)越多,網(wǎng)頁收錄的名次越高,該怎么做才能吸引蜘蛛收錄更多的頁面呢?下面我們就來看看詳細(xì)的教程,需要的朋友可以參考下

    標(biāo)簽:
    搜索引擎蜘蛛
  • SEO優(yōu)化:淺談如何避免蜘蛛陷阱

    在SEO優(yōu)化的過程中如何避免蜘蛛陷阱是非常重要的一件事情,本文主要為大家淺談幾招可以避免蜘蛛陷阱的方法,有興趣的朋友們就來了解下吧

熱門排行

信息推薦