此前,由于缺少有效的溝通渠道,使得網(wǎng)站站長或從事搜索引擎營銷的人士很難獲取到直接來自百度的信息。自 4 月 7 日百度創(chuàng)建站長俱樂部以來,這種局面有所改善,業(yè)內(nèi)幾位高人已經(jīng)受邀加入俱樂部,并代表站長們提出了一些針對百度在收錄、鏈接、權(quán)重、算法等方面的問題,這些問題大都由 Zac 與柳煥斌提出或代問,百度官方用 Lee 和 kkksuper 的 ID 陸續(xù)做了回答。由于目前百度站長俱樂部采取的是邀請機(jī)制,所以無法產(chǎn)生大規(guī)模互動交流,SEM Watch 將其中部分摘錄匯集,希望能夠引起各位朋友的關(guān)注與討論。想了解更多的內(nèi)容及信息請移步至這里,同時,如果有需要向百度打探情報的朋友也請留言,因?yàn)?Zac 大俠也是常駐 SEM Watch 的。
關(guān)于網(wǎng)站
問:使用虛擬主機(jī)的網(wǎng)站會不會因?yàn)橥粋€ IP 或同一臺服務(wù)器上有其他網(wǎng)站作弊被處罰而受連累,也被懲罰?
答:連坐,血統(tǒng)論等,是在極權(quán)社會里才出現(xiàn)的反人類政策。一個成熟的搜索引擎,這么蠻干的可能性很小。
問:將一個舊的 URL 進(jìn)行 301 重定向處理,百度反應(yīng)很慢?而且舊的 URL 會在相當(dāng)一段時間內(nèi)還存在于百度搜索結(jié)果中,但是網(wǎng)頁標(biāo)題是新的,缺少描述。
答:對于內(nèi)容遷移,我們推薦的做法就是將舊 URL 301 永久重定向到內(nèi)容對應(yīng)的新 URL,這樣我們會把舊 URL 積累的權(quán)值轉(zhuǎn)移到新 URL 上。
為了避免種種不穩(wěn)定的因素,目前我們的處理策略比較保守,新、舊 URL 會同時并存相當(dāng)長的時間。最近我們意識到這樣處理其實(shí)并不妥當(dāng),正在調(diào)研更迅速的處理方式,相信很快就可以完美的處理好這個問題。
問:百度對使用海外空間的中文網(wǎng)站有歧視嗎?百度是否會抓取域名注冊人的相關(guān) whois 信息?
答:1、百度對海外站點(diǎn)沒有歧視。但百度從國內(nèi)爬出去的蜘蛛,會嚴(yán)格遵守國家的政策和法令,所以國內(nèi)普通用戶訪問受限的內(nèi)容,百度蜘蛛一樣會搞不定。
2、任何對站點(diǎn)價值分析有貢獻(xiàn)的要素,都有可能被搜索引擎使用。并且這些要素的使用方式,也不是一成不變的。至于具體有哪些要素已經(jīng)被使用以及如何使用,這個無法詳述。
問:百度如何看待偽原創(chuàng)?
答:“偽原創(chuàng)”就是“非原創(chuàng)”。對非原創(chuàng)的策略,同樣適用于偽原創(chuàng)。歸根結(jié)底,這是一個技術(shù)實(shí)現(xiàn)程度問題,而不是策略思路問題。
ZAC:好多人認(rèn)為他們做的所謂“偽原創(chuàng)”挺好,應(yīng)該能騙過搜索引擎,這大概低估了搜索引擎算法。還是得回到根本,內(nèi)容為王。說起來容易,做起來難,很少人會認(rèn)真去做。
問:百度如何對待過期域名?谷歌對過期的域名很長一段時間還有收錄, 而百度卻很快就會將其清空。
答:過期域名也是域名,所以,適用于新域名的策略,也一樣適用于過期域名。只是過期域名在歷史上累積的與現(xiàn)有網(wǎng)站無關(guān)的權(quán)重,會被剝離掉,這也是很容易理解的。
關(guān)于收錄
問:大概在 4 月 1 日前后,很多站長用 site 查看自己在百度的收錄數(shù)量,發(fā)現(xiàn)狂降,現(xiàn)在好像又恢復(fù)了,那是怎么回事?
答:我們也注意到了這種說法,其實(shí)收錄方面沒什么變動,只是我們在上線新策略的過程中短暫影響了結(jié)果數(shù)估算算法,大家只要關(guān)注一下流量即可知道,那段時間從百度獲得的流量并沒有變化,如果收錄數(shù)真的發(fā)生了大的變動,肯定會影響流量。
另外,相信大家在用 site 語法查詢結(jié)果數(shù)時,也看到了搜索結(jié)果最上方的“找到的相關(guān)網(wǎng)頁數(shù)是估算值,不代表真實(shí)結(jié)果數(shù),僅供參考的提示”的提示,我們的搜索結(jié)果數(shù)估算算法是針對正常用戶的關(guān)鍵詞檢索而設(shè)計(jì),沒有針對site語法檢索做過優(yōu)化,它得出的搜索結(jié)果數(shù)只能做為一個參考,建議關(guān)注網(wǎng)站從百度獲得的流量有沒有變動更直接。
問:網(wǎng)站用 site: 查詢,只有首頁收錄,請問是什么機(jī)制造成的?
答:兩種情況:
1、新站點(diǎn),具體內(nèi)容還沒來得及抓取和索引。
2、老站點(diǎn),因?yàn)榉N種原因被嚴(yán)厲懲罰了,站長圈俗稱“拔毛”。
后者的嚴(yán)厲懲罰機(jī)制,我們期望逐漸演化為更合理的甄別和處理。實(shí)際上現(xiàn)在的狀況,比之四、五年前,已經(jīng)人性化多了。呵呵。
問:一般來說,網(wǎng)站所有者不是太希望 https 的網(wǎng)頁被收錄。如果收錄了,如果處理?把 https 的網(wǎng)頁 URL 更換成 http 形式的?還有一種情況,就是 ip 地址形式的URL被收錄。
答:如果不希望被收錄,常規(guī)的做法是設(shè)置 robots 文件。
https 主要的出發(fā)點(diǎn)是安全,并沒有太多考慮搜索引擎。從用戶角度,很多采用了 https 的站點(diǎn)(尤其是首頁),也是需要被搜索到的,比如支付寶,貝寶等。通常情況下,搜索引擎對這類網(wǎng)頁并不做內(nèi)容解析,而只是將 URL 進(jìn)行索引。
IP 地址的 URL 被收錄,除了 spider 在機(jī)制上的不完善之外,通常站點(diǎn)設(shè)計(jì)上也有一些缺陷。一般情況下,這類問題是可以被規(guī)避的。
問:百度數(shù)據(jù)更新的周期大概是多長?
答:如果是一個變化頻繁的入口索引頁面,相信這個變化周期會很短;而是相對穩(wěn)固的內(nèi)容型頁面,周期則會相對較長。站長們觀察一下蜘蛛的爬取日志,發(fā)現(xiàn)的規(guī)律會比這邊的說明更有價值。
此外,搜索結(jié)果頁上的那個時間,一直很讓人confusing,我們正在考慮修改。
關(guān)于權(quán)重
問:百度是否跟蹤 JS 鏈接并傳遞權(quán)重?因?yàn)橛械臅r候某些頁面得到太多權(quán)重沒什么意義,比如用戶登錄、注冊頁面之類的。是否可以用簡單的 JS 阻擋鏈接傳遞權(quán)重?
答:javascript 的解析,是很多搜索引擎正在做的事情;同理,對 flash 的解析。畢竟有那么多應(yīng)用 javascript 或者 flash 的網(wǎng)站,其實(shí)并沒有意識到,他們的做法給搜索引擎的收錄和索引帶來的麻煩。所以,如果期望不被搜索引擎收錄的話,最直接的手段,還是寫 robots 文件。
問:百度目前支持鏈接的 nofollow 屬性嗎?
答:百度現(xiàn)在支持 nofollow 標(biāo)簽。帶 nofollow 標(biāo)簽的鏈接,我們會忽略掉它絕大部分的作用。
nofollow主要用在用戶留言等不受站長控制的地方,這些地方的投票不是站長的意志,告訴搜索引擎不要給他投票是合適的。
問:百度對子域名如 news.domain.com 和主域名 www.domain.com 權(quán)重怎么處理?是當(dāng)作兩個不同的網(wǎng)站還是子域名會繼承主域名的權(quán)重?
答:怎樣處理是合乎邏輯的,策略上就會采用那個合乎常理的處理手段?;蛘哌@樣講,如果你是負(fù)責(zé)這個權(quán)重處理的,你覺得怎樣做是最合理的?那么很可能百度就是如你所想的。呵呵。
搜索引擎理解起來并不復(fù)雜,站在用戶角度考量,很容易揣摩搜索引擎的策略思路。
關(guān)于鏈接
問:當(dāng)前做SEO的同學(xué)們,都在瘋狂的購買鏈接。表現(xiàn)最為突出的即是各大 SF 類網(wǎng)站,他們?nèi)峭ㄟ^購買大量的友情鏈接來 強(qiáng)J搜索引擎而上來的。(像傳世 SF,前幾名的站每個月的鏈接費(fèi)用就至少超過五萬。)
那么,對于這種明顯的,通過大量購買鏈接來作 SEO,強(qiáng)行登頂?shù)淖鞣ń窈笫欠駮艿桨俣鹊膽土P?
因?yàn)榫湍壳皝砜?,百度對購買鏈接還沒有一點(diǎn)懲罰的跡象,一般的詞,網(wǎng)站收錄后,只要稍加更新然后狂買兩個月鏈接,絕對進(jìn)前三名。
而谷歌老早就說明確了。通過購買鏈接來增加 PR 會受到懲罰,百度在這方面的算法是否也應(yīng)該更新一下了?
答:這種手段奏效,說明百度在識別和處理超鏈作弊方面,仍存在很多問題。這類問題理應(yīng)得到妥善的解決,以使互聯(lián)網(wǎng)環(huán)境得到凈化。我們回頭會和相關(guān)的同事就此問題了解一下。
ZAC:提問的網(wǎng)友和其他人相信都感謝 Lee 的回答,也希望百度能在這方面改進(jìn),打擊垃圾鏈接和網(wǎng)站。
下面是提問網(wǎng)友的回復(fù):
這種狂買鏈接頂排名的做法已經(jīng)有一年多了,到現(xiàn)在為止“做百度就是要靠買鏈接”已經(jīng)在站長圈子里成為眾人皆知道的事情,而且各大站長類網(wǎng)站還都開設(shè)了鏈接買賣的版塊,以 A5 為例每天站長買賣鏈接的費(fèi)用就有好幾萬,現(xiàn)在可以直接的說對于百度指數(shù)在一萬左右的詞,多買一些鏈接,排名在 20 天左右絕對可進(jìn)前三名。希望百度的相關(guān)技術(shù)組對這一問題好好處理一下。
問:最近黑進(jìn) gov 或?qū)W校網(wǎng)站加上自己網(wǎng)站鏈接盛行。百度內(nèi)部評估對這種黑鏈的鑒別準(zhǔn)確性有多高?如果搜索引擎不能鑒別,普通企業(yè)和站長面對黑鏈很難競爭。
答:這個問題早已留意到,并一直在應(yīng)對策略的完善中。
大批毫無道德和法律底線的人,使得中國互聯(lián)網(wǎng)的生態(tài)環(huán)境變得非常惡劣。但按我們的理解,除了搜索引擎強(qiáng)化技術(shù)應(yīng)對方案之外,中國法治的完善,才是對這類違法犯罪行為進(jìn)行遏制的根本手段。目前互聯(lián)網(wǎng)相關(guān)的立法,遠(yuǎn)落后于互聯(lián)網(wǎng)的發(fā)展。
問:目前刷百度相關(guān)搜索和搜索下拉框的方法很多,怎樣才能限制或者根除這種現(xiàn)象。有沒有像投訴平臺這樣的地方,可以讓大家投訴,給大家一個更好的相關(guān)搜索?
答:這個問題的確很惱人。目前我們正在全力處理中,可預(yù)期將有大幅改觀。
投訴可以發(fā)送到 webmaster@baidu.com,肯定可以送達(dá)相關(guān)工程師,但不會有具體的回復(fù)。此外,處理多半是策略級的升級,個案的針對性處理會比較少。
關(guān)于算法
問:百度是否有會估算某網(wǎng)頁的某個反向鏈接被點(diǎn)擊次數(shù)(例如:從工具條、流量統(tǒng)計(jì)等工具得到的部分?jǐn)?shù)據(jù))?比如是否把鏈接的點(diǎn)擊率計(jì)入算法之中?是否會利用這點(diǎn)來判斷哪些是隱藏鏈接?或者判斷外鏈的相關(guān)性等因素。
答:我只能說,一切有利于排序改進(jìn)的因素,都有可能被搜索引擎嘗試應(yīng)用。
任何能改善排序效果的要素,搜索引擎都可能會嘗試應(yīng)用,不管是toolbar,analytics,rss訂閱等等。
問:目前谷歌已經(jīng)把網(wǎng)頁加載速度納入頁面排名影響因素,百度是否也考慮此因素決定網(wǎng)站搜索排名?
答:這是很容易想到的一個網(wǎng)站價值評價要素。但如何有效應(yīng)用,并不是一件很容易的事情,需要非常謹(jǐn)慎。中國尤其復(fù)雜,不同網(wǎng)段差異甚大。但顯著影響到用戶體驗(yàn)的廣泛要素,最終都會被搜索引擎謹(jǐn)慎的嘗試和使用吧。
問:Google 有 PR 指數(shù),搜狗有指數(shù),百度有什么?或許百度已經(jīng)有對網(wǎng)頁進(jìn)行質(zhì)量評分了,暫時沒有對外開放?以后會有這樣的網(wǎng)頁評級指數(shù)么?
答:多公布一個評級指數(shù),只是為站長們多帶來一分煩惱。事實(shí)上,很少有成熟的搜索引擎會發(fā)布用于最終質(zhì)量評級的指數(shù)。按照 Google 的官方說法,PR 也只是諸多排序因子中的一個而已。
問:百度如何對站外作弊的手法判斷是不是競爭對手所做,比如買黑鏈,建群站,群發(fā)垃圾垃圾等,這些競爭對手都能幫你做??煞裢嘎断掳俣葘@個判斷的原理,站長如何防范,發(fā)現(xiàn)被人陷害的話,如何舉報或采取其他措施?
答:如果想維護(hù)一個策略的生命周期的話,最好的方式是保守策略細(xì)節(jié)的秘密。但有一點(diǎn)可以確定,一個成熟的搜索引擎,不會輕易的通過一兩個要素來判斷一個網(wǎng)站的生死。
在回答問題的同時,百度俱樂部的發(fā)言人也透露了百度近期會發(fā)布一個搜索引擎優(yōu)化指南,里面有百度推薦的網(wǎng)站建設(shè)方法,以及一些會危害到權(quán)重的做法。(整理:SEMWatch)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!