當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

百度原創(chuàng)星火計劃 搜索引擎如何識別重復內容

 2013-07-09 15:33  來源: 婁底人才網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

百度搜索引擎為了整頓互聯(lián)網(wǎng)的信息內容,大尺度推出“百度原創(chuàng)星火計劃”,為了此計劃能高力度執(zhí)行,建立了相應的專題頁,更是邀請高質量的站點加入星火計劃。我們現(xiàn)在面對的正是一個充斥著“重復內容”、“大量垃圾內容”的時代,星火計劃中搜索引擎又是如何識別重復內容的?

搜索引擎為給用戶提供高質量的內容,在用戶搜索相關內容時,會通過一些過濾機制過濾掉重復的內容,而不是展示出大量重復相同的結果,如果網(wǎng)站存在大量重復內容,在搜索引擎過濾過程中可能會給網(wǎng)站帶來影響。

搜索引擎來站點抓取內容之前,已經(jīng)有爬行頁面預計,如果網(wǎng)站存在大量的重復頁面,蜘蛛會對這些頁面進行一一檢索,雖然在返回的結果被過濾,但是卻浪費了蜘蛛對站點頁面抓取的預算,減少了蜘蛛抓取其他高質量頁面的機會,重復頁面一樣的也會分散網(wǎng)站的整體權重,這樣并導致蜘蛛中能獲取到的有意義的頁面減少。

站長無法判斷搜索蜘蛛會抓取重復頁面中那個版本,搜索引擎自己也無法清除說明,用戶不同的搜索,蜘蛛返回的頁面可能是不同的,存在的重復頁面可能也有不同的偏向,用戶搜索時返回的頁面是否是你最喜歡返回的頁面,是否能給你帶來最高的流量轉化率?這些都是不得而知的,要想減少重復頁面的權重分散,可以在robots文件中屏蔽收錄,或者添加canonical標簽轉移權重。

像上面分析到的情況,重復內容會影響蜘蛛的抓取。同時,搜素引擎為了互聯(lián)網(wǎng)生態(tài)公平健康發(fā)展及優(yōu)質原創(chuàng)網(wǎng)站的集體利益,減少原創(chuàng)價值被采集站所得,會對重復、裝載、垃圾信息站點進行懲罰。搜素引擎提出這樣的申明,它又是怎么去識別重復內容的呢?

重復內容可以發(fā)生在不同的站點,也可以發(fā)生在同一個網(wǎng)站上,非優(yōu)化的SEO優(yōu)化CMS系統(tǒng),導致網(wǎng)站存在多個URL地址可訪問同一個頁面,這樣的情況也是重復內容,蜘蛛遇到這樣的情況時會判斷哪個頁面才是重要的頁面,會先從robots文件中檢測,是否有禁止抓取的地址,如果有則停止對重復頁面地址的抓取,如果沒有就會繼續(xù)抓取內容,在抓取時于遇到meta標簽,注明noindex這些頁面并不是為蜘蛛準備的,這種情況蜘蛛也同樣不會繼續(xù)抓取重復,減少蜘蛛的抓取難度,即使是重復的內容,蜘蛛也只會抓取有價值的那個版本。

百度的星火計劃邀請站長參與原創(chuàng)站點,如果您的網(wǎng)站是本網(wǎng)站首創(chuàng),非抄襲模仿的、內容和形式都具有獨特個性的資源;且具有社會共識價值的資源,符合國家相關規(guī)定;不在第二次裝載及偽原創(chuàng)之內;您并可提交您的站點到百度原創(chuàng)星火計劃站點。這種方法可減少因為站點權重不高,網(wǎng)站內容在被高權重網(wǎng)站轉載后,蜘蛛會認為轉載的站點是原創(chuàng)的內容,你的站反而是轉載采集站點。

搜索引擎到底如何判斷網(wǎng)站內容是否原創(chuàng),重復內容頁面中到底哪個頁面才是原創(chuàng)頁面,這是任何一個搜索引擎都未曾公布的算法。但婁底人才網(wǎng)()從百度官方的數(shù)據(jù)了解到,具有“原創(chuàng)”標簽的網(wǎng)站,原創(chuàng)星火計劃上線前后的同期流量對比顯示,原創(chuàng)url流量增長明顯。同時,原創(chuàng)星火計劃上線后一段時間內原創(chuàng)url流量增長明顯并逐漸趨于平穩(wěn),可見如果網(wǎng)站能加入百度原創(chuàng)計劃,網(wǎng)站在流量提升方面還是有很大幫助的。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 百度原創(chuàng)保護功能正式關閉

    百度原創(chuàng)保護功能上線的那一刻,我沒有抱任何幻想,百度原創(chuàng)保護功能下線的那一刻,我不曾有失落的心情,面對百度,面對SEO,早已淡然,與其糾結,不如放下。我們需要做的不是怎么迎合百度,而是怎么滿足用戶,提升用戶體驗。

  • 百度原創(chuàng)標識新階段網(wǎng)站內容如何做

    百度之前一直呼吁站長應該重視,文章質量度特別是原創(chuàng)文章。從百度之前推出的星火計劃開始,一直到現(xiàn)在都在提醒站長對于網(wǎng)站內容建設問題。不在僅僅是抄襲和轉載別人文章,應該從用戶本身出發(fā)來做內容。最近一兩月,很多站長都在反饋網(wǎng)站降權,排名全無情況出現(xiàn)。小編在查看朋友網(wǎng)站出現(xiàn)排名下降的文章,發(fā)現(xiàn)很多站長內容都

  • 談談百度原創(chuàng)算法的致命失誤

    起這么一個標題,不是為了做標題榜,而是從自己作為一個小站長的角度來思考,百度目前的原創(chuàng)算法是存在致命缺陷的。先從我的經(jīng)歷聊起最近在檢查自己所做的兩個網(wǎng)站時發(fā)現(xiàn)了這樣的事。這兩個網(wǎng)站都是自己原創(chuàng)內容的網(wǎng)站,弄了好幾個編輯寫內容。網(wǎng)站無論從用戶體驗還是從內容原創(chuàng)角度,都不差。但近一年了流量一直是半死不活

  • 百度是如何保護原創(chuàng)的?談百度原創(chuàng)那點事

    原創(chuàng)一直是大問題,往大了說,互聯(lián)網(wǎng)生態(tài)環(huán)境日趨惡劣,采集偽原創(chuàng)低質量內容泛濫,嚴重擠占了優(yōu)質原創(chuàng)資源的生存空間。導致互聯(lián)網(wǎng)資源整體質量大幅下降,網(wǎng)民受損、優(yōu)質站長受損、搜索引擎亦受損。往小了說,很多站長一直在進行原創(chuàng)建設,而得不到應有的保護。如何加大對站點原創(chuàng)的保護以及如何衡量原創(chuàng)是否能滿足用戶需求

  • 百度原創(chuàng)算法——必死!

    作為新生,我也問過一些前輩“菜鳥怎么做seo”他們會說:多原創(chuàng),多外鏈收錄自然就有了,有了權重有了pr漸漸的排名就會上去了。但是原創(chuàng)真的有用么?答案絕對是肯定的!但是你寫的原創(chuàng)有效果么?答案是模糊的!原因有如下幾點:

熱門排行

信息推薦