當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

百度原創(chuàng)星火計(jì)劃 搜索引擎如何識(shí)別重復(fù)內(nèi)容

 2013-07-09 15:33  來(lái)源: 婁底人才網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

百度搜索引擎為了整頓互聯(lián)網(wǎng)的信息內(nèi)容,大尺度推出“百度原創(chuàng)星火計(jì)劃”,為了此計(jì)劃能高力度執(zhí)行,建立了相應(yīng)的專(zhuān)題頁(yè),更是邀請(qǐng)高質(zhì)量的站點(diǎn)加入星火計(jì)劃。我們現(xiàn)在面對(duì)的正是一個(gè)充斥著“重復(fù)內(nèi)容”、“大量垃圾內(nèi)容”的時(shí)代,星火計(jì)劃中搜索引擎又是如何識(shí)別重復(fù)內(nèi)容的?

搜索引擎為給用戶(hù)提供高質(zhì)量的內(nèi)容,在用戶(hù)搜索相關(guān)內(nèi)容時(shí),會(huì)通過(guò)一些過(guò)濾機(jī)制過(guò)濾掉重復(fù)的內(nèi)容,而不是展示出大量重復(fù)相同的結(jié)果,如果網(wǎng)站存在大量重復(fù)內(nèi)容,在搜索引擎過(guò)濾過(guò)程中可能會(huì)給網(wǎng)站帶來(lái)影響。

搜索引擎來(lái)站點(diǎn)抓取內(nèi)容之前,已經(jīng)有爬行頁(yè)面預(yù)計(jì),如果網(wǎng)站存在大量的重復(fù)頁(yè)面,蜘蛛會(huì)對(duì)這些頁(yè)面進(jìn)行一一檢索,雖然在返回的結(jié)果被過(guò)濾,但是卻浪費(fèi)了蜘蛛對(duì)站點(diǎn)頁(yè)面抓取的預(yù)算,減少了蜘蛛抓取其他高質(zhì)量頁(yè)面的機(jī)會(huì),重復(fù)頁(yè)面一樣的也會(huì)分散網(wǎng)站的整體權(quán)重,這樣并導(dǎo)致蜘蛛中能獲取到的有意義的頁(yè)面減少。

站長(zhǎng)無(wú)法判斷搜索蜘蛛會(huì)抓取重復(fù)頁(yè)面中那個(gè)版本,搜索引擎自己也無(wú)法清除說(shuō)明,用戶(hù)不同的搜索,蜘蛛返回的頁(yè)面可能是不同的,存在的重復(fù)頁(yè)面可能也有不同的偏向,用戶(hù)搜索時(shí)返回的頁(yè)面是否是你最喜歡返回的頁(yè)面,是否能給你帶來(lái)最高的流量轉(zhuǎn)化率?這些都是不得而知的,要想減少重復(fù)頁(yè)面的權(quán)重分散,可以在robots文件中屏蔽收錄,或者添加canonical標(biāo)簽轉(zhuǎn)移權(quán)重。

像上面分析到的情況,重復(fù)內(nèi)容會(huì)影響蜘蛛的抓取。同時(shí),搜素引擎為了互聯(lián)網(wǎng)生態(tài)公平健康發(fā)展及優(yōu)質(zhì)原創(chuàng)網(wǎng)站的集體利益,減少原創(chuàng)價(jià)值被采集站所得,會(huì)對(duì)重復(fù)、裝載、垃圾信息站點(diǎn)進(jìn)行懲罰。搜素引擎提出這樣的申明,它又是怎么去識(shí)別重復(fù)內(nèi)容的呢?

重復(fù)內(nèi)容可以發(fā)生在不同的站點(diǎn),也可以發(fā)生在同一個(gè)網(wǎng)站上,非優(yōu)化的SEO優(yōu)化CMS系統(tǒng),導(dǎo)致網(wǎng)站存在多個(gè)URL地址可訪問(wèn)同一個(gè)頁(yè)面,這樣的情況也是重復(fù)內(nèi)容,蜘蛛遇到這樣的情況時(shí)會(huì)判斷哪個(gè)頁(yè)面才是重要的頁(yè)面,會(huì)先從robots文件中檢測(cè),是否有禁止抓取的地址,如果有則停止對(duì)重復(fù)頁(yè)面地址的抓取,如果沒(méi)有就會(huì)繼續(xù)抓取內(nèi)容,在抓取時(shí)于遇到meta標(biāo)簽,注明noindex這些頁(yè)面并不是為蜘蛛準(zhǔn)備的,這種情況蜘蛛也同樣不會(huì)繼續(xù)抓取重復(fù),減少蜘蛛的抓取難度,即使是重復(fù)的內(nèi)容,蜘蛛也只會(huì)抓取有價(jià)值的那個(gè)版本。

百度的星火計(jì)劃邀請(qǐng)站長(zhǎng)參與原創(chuàng)站點(diǎn),如果您的網(wǎng)站是本網(wǎng)站首創(chuàng),非抄襲模仿的、內(nèi)容和形式都具有獨(dú)特個(gè)性的資源;且具有社會(huì)共識(shí)價(jià)值的資源,符合國(guó)家相關(guān)規(guī)定;不在第二次裝載及偽原創(chuàng)之內(nèi);您并可提交您的站點(diǎn)到百度原創(chuàng)星火計(jì)劃站點(diǎn)。這種方法可減少因?yàn)檎军c(diǎn)權(quán)重不高,網(wǎng)站內(nèi)容在被高權(quán)重網(wǎng)站轉(zhuǎn)載后,蜘蛛會(huì)認(rèn)為轉(zhuǎn)載的站點(diǎn)是原創(chuàng)的內(nèi)容,你的站反而是轉(zhuǎn)載采集站點(diǎn)。

搜索引擎到底如何判斷網(wǎng)站內(nèi)容是否原創(chuàng),重復(fù)內(nèi)容頁(yè)面中到底哪個(gè)頁(yè)面才是原創(chuàng)頁(yè)面,這是任何一個(gè)搜索引擎都未曾公布的算法。但婁底人才網(wǎng)()從百度官方的數(shù)據(jù)了解到,具有“原創(chuàng)”標(biāo)簽的網(wǎng)站,原創(chuàng)星火計(jì)劃上線前后的同期流量對(duì)比顯示,原創(chuàng)url流量增長(zhǎng)明顯。同時(shí),原創(chuàng)星火計(jì)劃上線后一段時(shí)間內(nèi)原創(chuàng)url流量增長(zhǎng)明顯并逐漸趨于平穩(wěn),可見(jiàn)如果網(wǎng)站能加入百度原創(chuàng)計(jì)劃,網(wǎng)站在流量提升方面還是有很大幫助的。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 百度原創(chuàng)保護(hù)功能正式關(guān)閉

    百度原創(chuàng)保護(hù)功能上線的那一刻,我沒(méi)有抱任何幻想,百度原創(chuàng)保護(hù)功能下線的那一刻,我不曾有失落的心情,面對(duì)百度,面對(duì)SEO,早已淡然,與其糾結(jié),不如放下。我們需要做的不是怎么迎合百度,而是怎么滿足用戶(hù),提升用戶(hù)體驗(yàn)。

    標(biāo)簽:
    百度原創(chuàng)
  • 百度原創(chuàng)標(biāo)識(shí)新階段網(wǎng)站內(nèi)容如何做

    百度之前一直呼吁站長(zhǎng)應(yīng)該重視,文章質(zhì)量度特別是原創(chuàng)文章。從百度之前推出的星火計(jì)劃開(kāi)始,一直到現(xiàn)在都在提醒站長(zhǎng)對(duì)于網(wǎng)站內(nèi)容建設(shè)問(wèn)題。不在僅僅是抄襲和轉(zhuǎn)載別人文章,應(yīng)該從用戶(hù)本身出發(fā)來(lái)做內(nèi)容。最近一兩月,很多站長(zhǎng)都在反饋網(wǎng)站降權(quán),排名全無(wú)情況出現(xiàn)。小編在查看朋友網(wǎng)站出現(xiàn)排名下降的文章,發(fā)現(xiàn)很多站長(zhǎng)內(nèi)容都

  • 談?wù)劙俣仍瓌?chuàng)算法的致命失誤

    起這么一個(gè)標(biāo)題,不是為了做標(biāo)題榜,而是從自己作為一個(gè)小站長(zhǎng)的角度來(lái)思考,百度目前的原創(chuàng)算法是存在致命缺陷的。先從我的經(jīng)歷聊起最近在檢查自己所做的兩個(gè)網(wǎng)站時(shí)發(fā)現(xiàn)了這樣的事。這兩個(gè)網(wǎng)站都是自己原創(chuàng)內(nèi)容的網(wǎng)站,弄了好幾個(gè)編輯寫(xiě)內(nèi)容。網(wǎng)站無(wú)論從用戶(hù)體驗(yàn)還是從內(nèi)容原創(chuàng)角度,都不差。但近一年了流量一直是半死不活

  • 百度是如何保護(hù)原創(chuàng)的?談百度原創(chuàng)那點(diǎn)事

    原創(chuàng)一直是大問(wèn)題,往大了說(shuō),互聯(lián)網(wǎng)生態(tài)環(huán)境日趨惡劣,采集偽原創(chuàng)低質(zhì)量?jī)?nèi)容泛濫,嚴(yán)重?cái)D占了優(yōu)質(zhì)原創(chuàng)資源的生存空間。導(dǎo)致互聯(lián)網(wǎng)資源整體質(zhì)量大幅下降,網(wǎng)民受損、優(yōu)質(zhì)站長(zhǎng)受損、搜索引擎亦受損。往小了說(shuō),很多站長(zhǎng)一直在進(jìn)行原創(chuàng)建設(shè),而得不到應(yīng)有的保護(hù)。如何加大對(duì)站點(diǎn)原創(chuàng)的保護(hù)以及如何衡量原創(chuàng)是否能滿足用戶(hù)需求

    標(biāo)簽:
    百度原創(chuàng)
  • 百度原創(chuàng)算法——必死!

    作為新生,我也問(wèn)過(guò)一些前輩“菜鳥(niǎo)怎么做seo”他們會(huì)說(shuō):多原創(chuàng),多外鏈?zhǔn)珍涀匀痪陀辛?,有了?quán)重有了pr漸漸的排名就會(huì)上去了。但是原創(chuàng)真的有用么?答案絕對(duì)是肯定的!但是你寫(xiě)的原創(chuàng)有效果么?答案是模糊的!原因有如下幾點(diǎn):

    標(biāo)簽:
    百度原創(chuàng)

熱門(mén)排行

信息推薦