6月7日消息,近日百度悄然上線了極光算法,該算法推出了“網(wǎng)站落地頁時間因子”的概念,其實就是網(wǎng)站內(nèi)容的發(fā)布和更新時間。通過固定格式的代碼就可以提交內(nèi)容發(fā)布的時間。并且優(yōu)質(zhì)、時效性更強的內(nèi)容排序會靠前,但具體效果如何還有待于觀察。該算法會作用于所有網(wǎng)站類似,包括論壇、問答、新聞資訊等。早在2013年百度官方就推出了原創(chuàng)星火計劃,為了鼓勵優(yōu)質(zhì)的原創(chuàng)內(nèi)容,不過打擊抄襲、采集的垃圾內(nèi)容并不容易。
加入時間因子判斷內(nèi)容質(zhì)量
對于百度搜索引擎來說,如何判斷內(nèi)容是否為某站的原創(chuàng),這一點從技術(shù)層面來說很困難。互聯(lián)網(wǎng)上的大大小小的網(wǎng)站數(shù)量巨大,而轉(zhuǎn)載和抄襲的內(nèi)容也很多。如果加入了“時間因子”的因素,那么就可以通過時間指標(biāo)來判斷內(nèi)容是否為原創(chuàng)。不過前提是百度蜘蛛能夠爬行、記錄這些頁面,否則一些權(quán)重高的網(wǎng)站轉(zhuǎn)載新站上的內(nèi)容,通常百度會先收錄權(quán)重高的頁面。當(dāng)然新站的內(nèi)容就很難再被收錄了,并且還會被誤認(rèn)為轉(zhuǎn)載或抄襲權(quán)重高的網(wǎng)站。
杜絕內(nèi)容轉(zhuǎn)載抄襲技術(shù)難題
要完全杜絕網(wǎng)站內(nèi)容被抄襲或轉(zhuǎn)載,操作起來難度很大,可以說是幾乎不可能的。此次百度推出極光算法,應(yīng)該從技術(shù)層面上去處罰那些頻繁抄襲、轉(zhuǎn)載他人的網(wǎng)站。如果在頁面上提交了時間因子,那么基本可以斷定該內(nèi)容是否為首發(fā)。但是這個數(shù)據(jù)量非常大,需要搜索引擎蜘蛛的爬行效率很高,否則很多小站上的內(nèi)容不能被索引和記錄。另外,讓網(wǎng)站運營者可以提交申訴頁面,如果發(fā)現(xiàn)某個權(quán)重高的網(wǎng)站轉(zhuǎn)載了自己的內(nèi)容,而且這些內(nèi)容也被百度收錄了,那么可以申請刪除收錄記錄。
內(nèi)容和更新頻率會更重要嗎
影響百度搜索排序的因素很多,百度早已取消了網(wǎng)頁快照,如今新算法強調(diào)的是內(nèi)容時間和更新頻率。或許內(nèi)容和更新頻率在排名因素中占的比例會提高。內(nèi)容的重要性無可厚非,但更新頻率也同樣重要,一個頁面或網(wǎng)站長期無更新,搜索引擎蜘蛛肯定不會光顧。百度每次推出新算法都會有針對性,只是互聯(lián)網(wǎng)數(shù)據(jù)量龐大,所以百度算法也難以做到百分之百有效,難免就有誤傷或漏網(wǎng)的站點。不過這個比例不能很大,否則新算法就是很失敗的。
新站或小站的權(quán)重遠不及一些門戶類型的大站,所以在搜索引擎面前肯定處于劣勢位置。但大站若抄襲或轉(zhuǎn)載小站上的內(nèi)容就屬于侵權(quán),搜索引擎應(yīng)該一視同仁的對待。
本文由 石景山杰飛電腦培訓(xùn) http://www.ps868.com/ 站長原創(chuàng) 轉(zhuǎn)載保留
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!