當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

蔣鑫鵬:百度搜索算法總結(jié)—關(guān)鍵詞分詞算法

 2012-05-12 21:22  來(lái)源: 蔣鑫鵬的博客   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

此文接上文百度算法總結(jié)詳細(xì)請(qǐng)點(diǎn)擊:蔣鑫鵬:百度算法總結(jié)

一、關(guān)于中文分詞:

1.中文分詞難度分析

首先要說(shuō)明下的是:普通用戶的搜索與做SEO或者更大說(shuō)熟悉網(wǎng)絡(luò)搜索用戶的搜索習(xí)慣是非常不一樣的,而恰巧普通搜索用戶是百度搜索的基礎(chǔ)力量。在開(kāi)頭贅述 這一點(diǎn)是蔣鑫鵬為了表達(dá)其對(duì)于百度搜索算法中的中文分詞的重視。因?yàn)?,?duì)于百度google這樣的第二代搜索引擎來(lái)說(shuō),采用的檢索技術(shù)主要是依靠關(guān)鍵字來(lái) 匹配的,而用戶對(duì)于關(guān)鍵詞的理解與機(jī)器程序?qū)τ陉P(guān)鍵詞的理解是有很大距離的。

在中文分詞方面百度勝過(guò)了Google,這是baidu取勝google的關(guān)鍵因素之一,中文的分詞比英文要復(fù)雜得多(同樣與中文分詞一樣麻煩的重要語(yǔ)言 還有日語(yǔ)、韓語(yǔ)、俄語(yǔ),這也是Google沒(méi)辦法在這幾個(gè)地區(qū)取勝的原因之一),蔣鑫鵬在這里因?yàn)槠蛔鲑樖?,有興趣的朋友可以研究一下拉丁語(yǔ)系(以英 文為例)的造句與中文造句的區(qū)別,中文造句不僅近義詞很多,而且語(yǔ)序變化無(wú)常,副詞太多(主謂賓之外的定狀補(bǔ),嘆詞等等)。

 

簡(jiǎn)單舉個(gè)例子“百度如何排名”“百度是如何排名的”“百度怎么排名”“百度是怎么排名的”“百度如何排位”“百度怎么排位”“百度按什么排名”“百度靠什 么排名”“百度的搜索是怎么排位的”……這幾個(gè)短語(yǔ)短句至少都包含一個(gè)意思“百度搜索結(jié)果的排名是什么規(guī)則(原理)”,除此之外,每個(gè)句子都有其他的含 義,如這些句子還包含有“怎么做百度排名(實(shí)現(xiàn)這個(gè)目標(biāo)的方法)”“百度是怎么進(jìn)行搜索排名的(原理實(shí)現(xiàn)的過(guò)程)”……

拿上面的例子來(lái)說(shuō):當(dāng)用戶輸入以上短句時(shí)(大多數(shù)情況下,普通用戶把百度當(dāng)做是萬(wàn)能的,所以才搜索SEO開(kāi)來(lái)這么不符合規(guī)則的搜索行為),百度要迅速的響應(yīng)出用戶需要的結(jié)果,這個(gè)時(shí)候,百度面臨的核心問(wèn)題是:

A.首先要知道用戶是要搜什么(語(yǔ)義分析,見(jiàn)“二”);

B.其次因?yàn)榘俣鹊臋z索方式目前仍然以關(guān)鍵詞匹配技術(shù)為主,所以要對(duì)用戶的搜索進(jìn)行分詞(下一段將分析百度如何分詞);

C.然后百度要通過(guò)分詞分出的結(jié)果,去數(shù)據(jù)庫(kù)中檢索匹配的快照;

D.上一步只是檢索出來(lái),還要進(jìn)行第四部的排名,這個(gè)時(shí)候已經(jīng)不是挑戰(zhàn)百度的難題了(雖然在SEO看來(lái),這一步確實(shí)是非常艱難的)

E.第五步要將得到的結(jié)果返回到搜索頁(yè)面給用戶使用,并且要完成其廣告的投放(百度競(jìng)價(jià)廣告),并要適當(dāng)推廣自己的產(chǎn)品(百度知道、百度文庫(kù)……)寫的有點(diǎn)亂,SEO顧問(wèn)蔣鑫鵬在此致歉,沒(méi)找到更好的陳述方式,望朋友們整理發(fā)揚(yáng)光大。

2.百度中文分詞方式:

百度對(duì)于中文的分詞不僅是大量的用戶搜索(這點(diǎn)不同于Google,百度畢竟是植根于中國(guó)文化的,對(duì)中文更了解),而且還有龐大的中文詞典數(shù)據(jù)庫(kù)作支撐, 并且動(dòng)態(tài)加入了搜索熱詞,搜索行為造詞等技術(shù),【從近期百度算法的調(diào)整看,百度比以前更加尊重用戶的搜索行為,就是用戶的輸入為首要,百度糾正次要,這點(diǎn) 那很重要哦】下面以實(shí)例來(lái)說(shuō),用戶搜索“百度如何排名?”時(shí)的分詞:

A.自然分割:包括標(biāo)點(diǎn)符號(hào)、空格引起的分割,這是首要因素,比如或者“百度 如何排名”這樣的搜索行為會(huì)被百度首先劃分為“百度”、“如何排名”,這一點(diǎn)是肯定的,要理解用戶搜索的行為意圖,首先是要尊重用戶的搜索行為;(這是 SEO顧問(wèn)蔣鑫鵬根據(jù)實(shí)戰(zhàn)中的觀察總結(jié)出的,做SEO的很多朋友可能沒(méi)注意到,在此提個(gè)醒)

B.中文詞庫(kù)分割:不難理解,“百度如何排名”將被分為“百度”“如何”“排名”這幾個(gè)詞,因?yàn)檫@是中文詞典里存在的詞,百度有龐大的中文詞典庫(kù)支撐,這個(gè)不是難度;

C.分詞組合分詞:B中的分詞顯然是不夠的,要更能理解用戶意圖,必須保證語(yǔ)義連貫,那么那三個(gè)詞可以組合成“百度如何排名”;“百度如何”+“排名”; “百度排名”+“如何”;“如何排名”+“百度”以及這幾個(gè)詞顛倒的組合,重要程度按照順序優(yōu)先原則,緊接著是倒序和雙向序列的分詞組合,分析切分有個(gè)基 本的原則就是最少的切分。

以上三點(diǎn)是通常意義上的分詞,除此之外,還有更麻煩的分詞需要百度處理,見(jiàn)后幾點(diǎn)。

D.分字:如果用戶搜索“百 度 如 何 排名”的時(shí)候,百度也是無(wú)可奈何的,因?yàn)槟悴荒芘袛喑鰜?lái)用戶就是在搜索“百度 如何 排名”,還得尊重用戶搜索行為,所以,不得不進(jìn)一步將中文詞進(jìn)行分字:“百”“度”“如”“何”“排名”,然后在進(jìn)行組合分詞,組成不同的詞組去數(shù)據(jù)庫(kù)中 匹配。

E.別音字/錯(cuò)別字:如有人搜索“白度如何排名”實(shí)際上是誤將“百度”打成“白度”,那么百度還要糾正這種錯(cuò)誤,但近期的調(diào)整看,百度不像以前通過(guò)詞庫(kù)近 義匹配來(lái)進(jìn)行糾錯(cuò)【而更多的是以用戶搜索后瀏覽的行為積累的數(shù)據(jù)來(lái)為糾錯(cuò)做準(zhǔn)備】(如搜索“白度”的很多用戶最后花更多時(shí)間在“百度”關(guān)鍵詞頁(yè)面上,那么 百度以后對(duì)于“白度”的搜索糾錯(cuò)會(huì)偏重到“百度”上!

當(dāng)然,這個(gè)詞是蔣鑫鵬舉例說(shuō)明,實(shí)際上百度搜索“白度”不是這樣的,例子可以參看百度的“美規(guī)車”查看,百度會(huì)提示或者說(shuō)試探你“您要找的是不是: 美規(guī)車”),此外,百度對(duì)于糾錯(cuò)通過(guò)搜索下拉框相關(guān)詞推薦、搜索頁(yè)面底部“相關(guān)搜索”、百度知道(用戶量很大,是百度搜索的重要補(bǔ)充)來(lái)進(jìn)行糾錯(cuò)數(shù)據(jù)的統(tǒng) 計(jì)與糾錯(cuò)引導(dǎo)。

F.新詞:新詞的來(lái)源一般有兩種:a.近期流行語(yǔ)造成,這個(gè)百度的數(shù)據(jù)庫(kù)會(huì)根據(jù)用戶搜索行為積累的數(shù)據(jù)以及網(wǎng)絡(luò)熱詞監(jiān)測(cè)數(shù)據(jù)來(lái)進(jìn)行調(diào)整補(bǔ)充到詞庫(kù);b.語(yǔ)言新詞/用戶造詞,這個(gè)主要是靠搜索行為累積的數(shù)據(jù)調(diào)整,也針對(duì)部分語(yǔ)言新詞人工作補(bǔ)充。

蔣鑫鵬再次補(bǔ)充說(shuō)明一下,百度其實(shí)很累的,它對(duì)用戶的每一次搜索行為都要進(jìn)行統(tǒng)計(jì)(當(dāng)然是機(jī)器程序記錄的方式):一般主要記錄搜索的關(guān)鍵詞、到訪的頁(yè)面及 到訪方式(一般都是鏈接)、各頁(yè)面停留時(shí)間(之前不容易讀取到,現(xiàn)在百度通過(guò)瀏覽cookis、百度賬戶、IP記錄、百度統(tǒng)計(jì)【如果網(wǎng)站裝了百度統(tǒng)計(jì)的程 序,實(shí)際上百度很聰明,用各種方式想盡辦法進(jìn)入到網(wǎng)站,比如最近流行的百度分享按鈕,這個(gè)工具實(shí)際上就是最大的間諜】等大量輔助工具來(lái)統(tǒng)計(jì)),一般測(cè)算是 根據(jù)搜索后到訪的百度提供的快照頁(yè)面的瀏覽行為(先打開(kāi)哪個(gè),然后打開(kāi)哪個(gè),在哪里停留的時(shí)間長(zhǎng),最后從哪里離開(kāi)百度來(lái)實(shí)現(xiàn),百度對(duì)于一個(gè)網(wǎng)頁(yè)對(duì)用戶是否 有用的觀點(diǎn):在該頁(yè)面停留時(shí)間最長(zhǎng),并最終在此頁(yè)面瀏覽完畢后離開(kāi)百度為首要標(biāo)準(zhǔn),其次還有在這些頁(yè)面的互動(dòng)程度所起的因素。

二、關(guān)于語(yǔ)義分析:

其實(shí)這段要說(shuō)的在上一段已經(jīng)都提到,列出來(lái)無(wú)非是將“語(yǔ)義分析”這一檢索行為與“分詞”區(qū)別開(kāi)來(lái),語(yǔ)義分析與分詞是相輔相成的,語(yǔ)義分析更多的建立在分詞 與用戶瀏覽行為習(xí)慣數(shù)據(jù)的研究結(jié)論基礎(chǔ)之上,如前所述,百度通過(guò)各種方式大量統(tǒng)計(jì)用戶的行為并針對(duì)這些行為及所用的關(guān)鍵詞及輸入方式索索的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分 詞的支撐與分詞的匹配。

畢竟,再怎么算,那么多網(wǎng)頁(yè)、每天數(shù)十億次的檢索行為,百度還是難以計(jì)算出來(lái)的(百度正在通過(guò)不斷改進(jìn)方式及完善機(jī)器算法來(lái)努力實(shí)現(xiàn)這一浩大工程),目前 主要采用的是針對(duì)熱門搜索的抽樣統(tǒng)計(jì)與其他搜索的隨機(jī)統(tǒng)計(jì)來(lái)實(shí)現(xiàn)搜索語(yǔ)義分析(此為SEO顧問(wèn)蔣鑫鵬根據(jù)實(shí)戰(zhàn)中的觀察做的假想推斷)。

 

百度最難以捉摸透的與其說(shuō)是排名算法,不如說(shuō)是語(yǔ)義分析算法,因?yàn)榕cSEO搞不懂百度算法一樣,百度同樣搞不懂搜索用戶的搜索意圖(所以百度一直在研究, 一直在調(diào)整,一直在完善,就像SEO一直在研究,一直在調(diào)整,一直在完善一樣的道理)。捉摸不透是一個(gè)原因,更重要的是這些計(jì)算不僅僅是對(duì)于文字及分詞、 匹配度的研究,更是通過(guò)統(tǒng)計(jì)學(xué)、線性數(shù)學(xué)、邏輯學(xué)、行為學(xué)、心理學(xué)等眾多的學(xué)科的精華計(jì)算方法結(jié)合在一起設(shè)計(jì)出的算法結(jié)構(gòu),并不斷修補(bǔ)完善的,說(shuō)到這個(gè)算 法,百度有一個(gè)形容“海量基礎(chǔ)算法”,更不用提每種算法的學(xué)科本身的難度了,這就是苦逼的SEO遲遲不能搞懂百度算法的根本原因,當(dāng)然,作為苦逼的 SEO,蔣鑫鵬同樣也是搞不懂的,如果能搞懂的,大多都是數(shù)學(xué)或計(jì)算機(jī)天才或頂尖人才,早都去搞自己的研究或者發(fā)明去了,還至于追在百度后面吹毛求疵?

更何況,百度本身對(duì)于搜索結(jié)果的“人為干涉”及“壟斷”都帶來(lái)各種斥責(zé),更何況SEO為了一己之利不斷刷排名給用戶推薦低質(zhì)量的信息,那就更遭懂得并理解 搜索算法的牛人看不起了……所以看到這里,如果你覺(jué)得你很牛,就不要做SEO了,如果作為SEO你明白了作者蔣鑫鵬寫此篇文章的意圖,那你就站在SEM或 者網(wǎng)絡(luò)運(yùn)營(yíng)、網(wǎng)絡(luò)營(yíng)銷的高度來(lái)看待SEO,而不是為了半夜趴在電腦前發(fā)外鏈混營(yíng)生而SEO。

扯遠(yuǎn)了,回歸正題,做不到像百度一樣設(shè)計(jì)算法的那個(gè)能耐,如果說(shuō)還能從語(yǔ)義分析中挖掘點(diǎn)對(duì)SEO有幫助的東西,那么蔣鑫鵬建議可以去研究研究你正在做的優(yōu) 化的相關(guān)詞的用戶搜索習(xí)慣,比如,蔣鑫鵬最近給上海智寶美規(guī)車www.zhibaosuv.com做網(wǎng)絡(luò)運(yùn)營(yíng)服務(wù)期間,發(fā)現(xiàn)“美規(guī)車”這一詞正在受到越來(lái) 越多的關(guān)注,而做這個(gè)詞優(yōu)化的很多SEO或者說(shuō)站長(zhǎng)都頂住“美規(guī)車”一個(gè)詞做,而這個(gè)詞用戶搜索的時(shí)候,有可能衍生為“美規(guī)汽車”“美規(guī)汽車SUV”“美 規(guī)車SUV”“美規(guī)SUV”“美規(guī)車銷售”“美規(guī)車經(jīng)銷”“美規(guī)車經(jīng)銷商”“美規(guī)汽車經(jīng)銷”“美規(guī)汽車銷售”“美規(guī)汽車進(jìn)口代理”等眾多的派生詞,甚至 “美規(guī)車哪里買”“上海哪兒銷售美規(guī)車”這樣的更具有成交意義的長(zhǎng)尾關(guān)鍵詞,如果理解用戶的搜索意圖,再針對(duì)性的做SEO,這樣取得的效果會(huì)更好。

三、關(guān)于關(guān)鍵詞匹配度:

1.關(guān)鍵詞分詞匹配重點(diǎn)次序:

這是蔣鑫鵬根據(jù)SEO實(shí)際操作結(jié)合網(wǎng)友分享做的總結(jié),精確度不高,但可作為參考。一般意義上的分詞算法是“關(guān)鍵詞比率”:計(jì)算該關(guān)鍵詞在頁(yè)面信息中的比 重,通常包含的參數(shù)有:title(網(wǎng)頁(yè)標(biāo)題)、meta description(網(wǎng)頁(yè)描述/摘要)、meta keywords(網(wǎng)頁(yè)關(guān)鍵詞)、網(wǎng)頁(yè)H1~H6標(biāo)簽、錨文本(按照重點(diǎn)程度及頁(yè)面位置排序)、內(nèi)容文本(突出程度如字體、大小、顏色、周圍的背景或者說(shuō) 文字等,一般的位置順序是從左上到右下)、圖片及其他頁(yè)面文件的Html標(biāo)記語(yǔ)言屬性。

2.關(guān)鍵詞匹配度計(jì)算:

分詞后,要對(duì)短語(yǔ)中的關(guān)鍵詞進(jìn)行“索庫(kù)”,如果某個(gè)詞在短語(yǔ)中與其他詞相關(guān)性不大,將去除匹配,但是其他詞計(jì)算匹配度時(shí)任然作為字?jǐn)?shù)計(jì)算。以“百度如何排 名”來(lái)分析:一般意義上,這個(gè)搜索短語(yǔ)被分為“百度如何排名”;“百度如何”+“排名”;“百度排名”+“如何”……:那么“百度如何排名”匹配度就是 100%,緊接著就是“百度排名如何”,“如何排名百度”,“如何百度排名”,“排名百度如何”,“排名如何百度”;“百度排名”的匹配度是1/3+1 /3=2/3;“如何排名”的匹配度是1/2;“百度”的匹配度是1/3……以上只是粗略的估算,具體的都多分詞算法還要加入相關(guān)參數(shù)計(jì)算,如順序優(yōu)先 度,倒序優(yōu)先度,雙序優(yōu)先度,最少化切詞度……(具體的算法因蔣鑫鵬學(xué)識(shí)有限,恕不能分享,在此只是一個(gè)基本思路的分析,可以供朋友們參考,另外分詞中含 有很多關(guān)于標(biāo)點(diǎn)符號(hào)、空格、單字等的處理)

3.title關(guān)鍵詞匹配度:

title中的關(guān)鍵詞在title本身的分詞匹配中的計(jì)算方式與2中提到的一樣,蔣鑫鵬在此想說(shuō)明兩點(diǎn):A.根據(jù)觀察推斷,百度收錄快照后,對(duì)快照的存檔 中應(yīng)該已經(jīng)做好可能的分詞及匹配度的數(shù)據(jù)標(biāo)注(如果不是這樣,那么百度檢索的效率不會(huì)有這么高)B.每一次用戶的檢索百度都要進(jìn)行分詞,并依分詞的結(jié)果從 從檔的快照中的分詞標(biāo)注中做最大化的匹配。

另外,Title的公認(rèn)長(zhǎng)度一般認(rèn)為是不超過(guò)80個(gè)字符(包含標(biāo)點(diǎn)及空格,折合中文漢字約為40個(gè)字),但從百度檢索結(jié)果的快照標(biāo)題中看,對(duì)于不同站點(diǎn)百 度根據(jù)權(quán)重會(huì)有不同的限制,一般為60個(gè)字符,有的站能達(dá)到70個(gè)字符,超過(guò)的部分用“…”代替,但并不意味著百度不計(jì)算在內(nèi),以 “www.zhibaosuv.com”來(lái)說(shuō),蔣鑫鵬再添加標(biāo)題的時(shí)候?qū)?ldquo;智寶美規(guī)車SUV”放到最后,但你百度“智寶美規(guī)車SUV”的時(shí)候現(xiàn)實(shí)的快照標(biāo) 題可以正常顯示“智寶美規(guī)車SUV”而將title超過(guò)顯示的部分以段前段后省略的方式顯示。

一般,如果沒(méi)有特殊必要,建議不要超過(guò)公認(rèn)的80字符,否則,不僅稀釋了關(guān)鍵詞的匹配度,還會(huì)影響搜索引擎對(duì)快照的打分。

【做title的技巧】,寫到此,順便分享下蔣鑫鵬的一點(diǎn)技巧,企業(yè)網(wǎng)站因?yàn)轫?yè)面少,一般容易獲得排名的主要是主頁(yè),所以主頁(yè)的title一定要精心布 置,如果實(shí)在放不下的關(guān)鍵詞放到description中靠前的位置,另外,建議將站點(diǎn)名稱簡(jiǎn)寫放在后面,以保證重點(diǎn)關(guān)鍵詞靠前而獲得較好的匹配度,站點(diǎn) 名稱用“【】”起來(lái),雖然浪費(fèi)了4個(gè)字符,但是在搜索結(jié)果中會(huì)比較突出,能吸引用戶的注意而提高網(wǎng)站知名度和進(jìn)入率。

順便提下,蔣鑫鵬在操作中發(fā)現(xiàn),如果頭部標(biāo)簽更新頻繁過(guò)度會(huì)被降權(quán)處理(一般頭部修改后會(huì)進(jìn)入快照觀察期,搜索結(jié)果對(duì)于修改后的標(biāo)題顯示會(huì)延遲1~3周不 等,具體根據(jù)不同關(guān)鍵詞在頁(yè)面內(nèi)容中的體現(xiàn)更新及外部鏈接錨文本中包含該關(guān)鍵詞的更新度不等而延遲時(shí)間不等),頭部標(biāo)簽一月內(nèi)修改2次以上,百度會(huì)直接隨 機(jī)抓取頁(yè)面內(nèi)的文本作為描述摘要。Google對(duì)于Title更新頻繁的頁(yè)面,會(huì)直接抓頁(yè)面布局中重點(diǎn)體現(xiàn)的某段短語(yǔ)做標(biāo)題。

4.description關(guān)鍵詞匹配度:

與title的計(jì)算方式類似,只不過(guò)description不會(huì)被百度像title一樣被分詞,而只作為title中關(guān)鍵詞和keyword中的關(guān)鍵詞以 及給給頁(yè)面帶來(lái)流量較大的關(guān)鍵詞的匹配計(jì)算,關(guān)鍵詞在description中的匹配度按照順序優(yōu)先原則,以關(guān)鍵詞在description總字符中的占 有比率及連貫度計(jì)算。

description是對(duì)頁(yè)面的摘要說(shuō)明,做SEO的童鞋務(wù)必遵守規(guī)則,不要將無(wú)關(guān)信息或者說(shuō)頁(yè)面文本中不包含的關(guān)鍵詞堆疊到此,以免降分。

description公認(rèn)的允許最大字符量為200,百度快照顯示的一般為140字符左右,蔣鑫鵬建議不要超過(guò)160字符,因?yàn)檫@樣不僅稀釋關(guān)鍵詞匹配 度,而且百度最近的算法調(diào)整,對(duì)description超出快照顯示的部分將不再做關(guān)鍵詞匹配。同樣以智寶美規(guī)車www.zhibaosuv.com來(lái)說(shuō) 明,蔣鑫鵬將美規(guī)GMC放在描述摘要最好,最近算法調(diào)整后不做顯示了(當(dāng)然可能是個(gè)案,僅供參考)。

5.keywords關(guān)鍵詞匹配度:

keywords對(duì)于百度來(lái)講,貌似本身不作為匹配,但是有一點(diǎn)百度很在意:不要將頁(yè)面沒(méi)有的關(guān)鍵詞加到keywords中,如果這樣,有可能會(huì)被認(rèn)為是在作弊,這點(diǎn)對(duì)于Google來(lái)說(shuō)更是如此,Google對(duì)于keywords作弊比百度嚴(yán)格的多。

 

keywords一般公認(rèn)的不超過(guò)100字符,這點(diǎn),蔣鑫鵬的理解是,對(duì)于Google來(lái)講:keywords一定不要過(guò)多,要與頁(yè)面匹配,一般頁(yè)面能容 忍的關(guān)鍵詞也就十多個(gè)到頭;對(duì)于百度來(lái)講,建議keywords的設(shè)計(jì)根據(jù)百度權(quán)重(可用站長(zhǎng)工具或愛(ài)站網(wǎng)測(cè)試)關(guān)鍵詞來(lái)設(shè)計(jì),有權(quán)重的詞,可以加到 keywords中。

對(duì)于企業(yè)網(wǎng)站而言,因?yàn)門itle和description限制而字?jǐn)?shù)有限,無(wú)法容納公司全稱,這個(gè)時(shí)候可以考慮將公司全稱及簡(jiǎn)稱在keywords中體現(xiàn)一下,因?yàn)轫?yè)面版權(quán)信息中一般會(huì)包含公司名和簡(jiǎn)稱。

6.頁(yè)面內(nèi)容中的關(guān)鍵詞匹配度:

頁(yè)面內(nèi)容不做分詞計(jì)算,但標(biāo)簽中的分詞和快照中存檔的分詞在頁(yè)面所占比列計(jì)算中會(huì)對(duì)頁(yè)面中包含的關(guān)鍵詞進(jìn)行匹配并計(jì)算次數(shù)及在整個(gè)頁(yè)面字符中所占比例。

頁(yè)面的關(guān)鍵詞重要程度首要的是H標(biāo)簽和其他重要的標(biāo)簽,當(dāng)然在百度快照中主要是按照頁(yè)面世家顯示的文字為標(biāo)準(zhǔn),一般鏈接錨文本中包含的關(guān)鍵詞、頁(yè)面突出位 置出現(xiàn)的關(guān)鍵詞、以突出的方式(字體、顏色)展示出的關(guān)鍵詞會(huì)比較重要,這點(diǎn)要根據(jù)具體頁(yè)面作分析,SEO朋友們可以在檢索關(guān)鍵詞結(jié)果中直接查看百度快照 中顯示的關(guān)鍵詞匹配程度,黃色最高,其次為紅色和藍(lán)色、綠色。

快照是存放在百度數(shù)據(jù)庫(kù)中的靜態(tài)網(wǎng)頁(yè),不是真實(shí)的網(wǎng)頁(yè),所以就有快照更新一說(shuō)。從快照頁(yè)面源代碼中可以看出,百度快照中只是記載了頁(yè)面的基本代碼及文本文件,并為存儲(chǔ)照片及其他文件,現(xiàn)實(shí)中的快照中的圖片是從頁(yè)面文件收錄快照時(shí)記錄的文件地址調(diào)用過(guò)來(lái)的。

百度快照的存在,才是大家都關(guān)心百度快站更新的根本原因,因?yàn)槿绻煺詹桓?,獲得排名的機(jī)會(huì)就會(huì)變少,這個(gè)時(shí)候的你的網(wǎng)站的快照在百度快照數(shù)據(jù)庫(kù)中就像 一個(gè)棄嬰……寫到此,作者蔣鑫鵬再次將自己的觀察提醒一下:以前大家都認(rèn)為靜態(tài)頁(yè)面更受搜索歡迎,隨著2.0的不斷發(fā)展及互聯(lián)網(wǎng)社交化的趨勢(shì),似乎這點(diǎn)正 在被改寫并朝著相反方向發(fā)展,靜態(tài)頁(yè)面、偽靜態(tài)開(kāi)始被搜索程序嫌棄……蔣鑫鵬是這樣理解的,如果頁(yè)面是靜態(tài)的,那么搜索引擎更容易認(rèn)為你的頁(yè)面內(nèi)容更新會(huì) 比較慢,這樣自然影響收錄頻率,蜘蛛到訪的頻次也就降低了……

四、關(guān)鍵詞匹配操作——實(shí)例分析

以上大致講述了SEO蔣鑫鵬對(duì)于百度搜索中文分詞及語(yǔ)義分析、關(guān)鍵詞匹配的皮毛理解,下文通過(guò)實(shí)例重點(diǎn)講一下如何讓網(wǎng)頁(yè)與關(guān)鍵詞進(jìn)行匹配。通常,SEO一 般接到的任務(wù)都是客戶/領(lǐng)導(dǎo)甩過(guò)來(lái)一個(gè)站,指定幾個(gè)關(guān)鍵詞,然后放手去做,除了在頭部標(biāo)簽加上關(guān)鍵詞,大量采集一些關(guān)鍵詞相關(guān)的文章,剩下的貌似都是用各 種工具進(jìn)行大量的“外部鏈接生產(chǎn)”工作了,一時(shí)間,包含“www.zhibaosuv.com”的亂七八糟的信息鋪天蓋地涌向各大論壇、博客、店鋪、分類 信息……(當(dāng)然,蔣鑫鵬也很低俗,做外鏈也大致是這樣操作的,只不過(guò)基本不用工具,盡量減匹配度高相關(guān)性強(qiáng)的站點(diǎn),針對(duì)性地發(fā)外鏈)。

實(shí)際上,更好的SEO方式,是在進(jìn)行排名優(yōu)化操作前,根據(jù)用戶的需求,做調(diào)查分析統(tǒng)計(jì),然后依次配合客戶其他需求,策劃網(wǎng)站方案,將SEO的意圖在建設(shè)網(wǎng) 站(www.jianzhan001.com眾志傳媒出品)的過(guò)程中很好地融入,這樣SEO做起來(lái)不累,也容易取得較為理想的效果,以上文中蔣鑫鵬提到的 服務(wù)中的客戶上海智寶名車的例子來(lái)說(shuō),建站之初,眾志傳媒根據(jù)客戶專營(yíng)進(jìn)口美規(guī)車SUV這一特點(diǎn),通過(guò)百度搜索指數(shù)、Google關(guān)鍵詞榜單、百度相關(guān)搜 索推薦、站長(zhǎng)工具(tool.chinaz.com)進(jìn)行過(guò)較為詳盡的統(tǒng)計(jì)分析,最后根據(jù)客戶主營(yíng)的美規(guī)奔馳、美規(guī)寶馬、美規(guī)奧迪、美規(guī)卡宴、美規(guī)路虎、 美規(guī)福特、美規(guī)豐田、美規(guī)林肯、美規(guī)GMC這些品牌車,確定了上述關(guān)鍵詞(【特別說(shuō)明,關(guān)鍵詞的策劃還要考慮百度競(jìng)價(jià)競(jìng)爭(zhēng)程度、頁(yè)面收錄數(shù)量、首頁(yè)結(jié)果頁(yè) 的快照更新程度及百度全匯總,以此來(lái)確定難易程度,結(jié)合預(yù)算與工作量來(lái)確定】)。

在網(wǎng)站設(shè)計(jì)工程中,眾志傳媒將產(chǎn)品展示這一欄目設(shè)計(jì)為“美規(guī)車頻道”,并依次將上述關(guān)鍵詞作為分類,并以下拉菜單的方式實(shí)現(xiàn)(蔣鑫鵬提醒:導(dǎo)航條的錨文本 出現(xiàn)的關(guān)鍵詞是很重要的,而現(xiàn)在做優(yōu)化,用戶對(duì)于關(guān)鍵詞數(shù)量要求越來(lái)越多,結(jié)合這一情況,蔣鑫鵬建議首選將導(dǎo)航做成頁(yè)面左側(cè)的列表通道【實(shí)戰(zhàn)中發(fā)現(xiàn)很有 效,以三禾彩鋼為例】,其次考慮希下拉表菜單及最近流行的頁(yè)面底部行列式導(dǎo)航),在主頁(yè)內(nèi)容安排有限的前提下,在底部將關(guān)鍵詞對(duì)應(yīng)的欄目頁(yè)URL做了輔助 導(dǎo)航,在首頁(yè)文字信息中恰當(dāng)?shù)貙㈠^文本融入,給主要的圖片做了ALT屬性等。

在title設(shè)計(jì)中,當(dāng)然“美規(guī)車”首選,其次根據(jù)關(guān)鍵詞順序排列優(yōu)先的原則,將主頁(yè)title設(shè)計(jì)為“美規(guī)車_美規(guī)奔馳,美規(guī)寶馬,美規(guī)路虎,美規(guī)卡 宴,美規(guī)奧迪【智寶美規(guī)車SUV】”,因?yàn)槠渌麕讉€(gè)關(guān)鍵詞無(wú)法擠在title中,檢索量及價(jià)值也不是很高,就放在了description中,并且在 description開(kāi)頭中加入“上海智寶名車公司,頂級(jí)美規(guī)車進(jìn)口商,豪華名車SUV美規(guī)版經(jīng)銷專賣”,即顯示了公司名稱,同時(shí)又突出了公司特點(diǎn)并在 此體現(xiàn)了核心關(guān)鍵詞“美規(guī)車”,接下來(lái)的“美規(guī)寶馬X5X6,美規(guī)奔馳ML/GL系列,美規(guī)保時(shí)捷卡宴,美規(guī)奧迪Q7,美規(guī)路虎攬勝極光,美規(guī)林肯外交 官,美規(guī)福特,美規(guī)豐田,美規(guī)GMC。”是對(duì)重點(diǎn)產(chǎn)品型號(hào)關(guān)鍵詞的體現(xiàn),如“美規(guī)寶馬X5”,“美規(guī)奧迪Q7”等。 畢竟頁(yè)面的頭部文件字符限制,導(dǎo)致很多有限關(guān)鍵詞不能體現(xiàn),對(duì)于www.zhibaosuv.com美規(guī)車這個(gè)網(wǎng)站,眾志傳媒做了內(nèi)鏈的優(yōu)化及各個(gè)頁(yè)面的 代碼優(yōu)化工作,完善了站內(nèi)所有頁(yè)面的頭部標(biāo)簽及頁(yè)面的其他標(biāo)簽、鏈接,保證每個(gè)頁(yè)面名稱都不重復(fù)。以美規(guī)車頻道 “;這個(gè)頁(yè)面來(lái)說(shuō),title采用了“美規(guī)車,美規(guī)奔馳配置,豪華車SUV美規(guī)版 價(jià)格_智寶美規(guī)車頻道”,核心關(guān)鍵詞、頁(yè)面重點(diǎn)關(guān)鍵詞、站點(diǎn)名稱及頁(yè)面名稱都在title中有良好的表現(xiàn),并且欄目頁(yè)面對(duì)應(yīng)的產(chǎn)品子頁(yè)面都是后臺(tái)發(fā)布新產(chǎn) 品生成的,每個(gè)頁(yè)面的標(biāo)題及描述摘要都是動(dòng)態(tài)調(diào)用了發(fā)布產(chǎn)品的名稱幾摘要。

在網(wǎng)站運(yùn)營(yíng)中,未獲得更多有價(jià)值的關(guān)鍵詞的流量,智寶美規(guī)車新聞發(fā)布中,盡量采用原創(chuàng)的信息,并配合美觀的圖片及表格,以提升網(wǎng)頁(yè)信息的可讀性,同時(shí),作 者不忘將關(guān)鍵詞在文章中以突出顯示的形式和加鏈接做成錨文本的形式表現(xiàn),更有利于網(wǎng)站內(nèi)部鏈接的建設(shè)及豐富,這在操作中獲得明顯的搜索表現(xiàn)。此外,新聞的 更新,邊體重都是包含有限關(guān)鍵詞的,在首頁(yè)調(diào)用最新發(fā)布新聞標(biāo)題的方式很好的保證了主頁(yè)的更新度。

寫的有點(diǎn)累贅,百度的算法不是一兩局說(shuō)得清楚的,眾志傳媒網(wǎng)絡(luò)營(yíng)銷顧問(wèn)在整理發(fā)布的,也只是皮毛,從SEO的價(jià)值來(lái)講,是一個(gè)理解SEO及百度關(guān)鍵詞匹配 計(jì)算法的分析思路,歡迎SEO童鞋們加入討論,蔣鑫鵬的微博: 求圍觀拍磚。本文來(lái)自蔣鑫鵬的博客()轉(zhuǎn)載請(qǐng)以鏈接形式標(biāo)明

本文地址本文地址:  

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 長(zhǎng)尾關(guān)鍵詞挖掘優(yōu)化與百度中文分詞

    正確理解百度中文分詞,對(duì)長(zhǎng)尾關(guān)鍵詞優(yōu)化有著非常大的幫助。今天,小編帶來(lái)的是《長(zhǎng)尾關(guān)鍵詞優(yōu)化與百度中文分詞》。希望對(duì)大家有所幫助。中文分詞:指的是將一個(gè)漢字序列切分成一個(gè)個(gè)單獨(dú)的詞。通俗地講,就是講一個(gè)長(zhǎng)尾關(guān)鍵詞分為幾個(gè)詞。

  • 淺談百度分詞與關(guān)鍵詞匹配度的優(yōu)化方法

    百度分詞技術(shù)一直是一門學(xué)問(wèn)。對(duì)于搜索詞,百度會(huì)不會(huì)進(jìn)行分詞,怎么分詞,會(huì)影響到我們確立目標(biāo)關(guān)鍵詞及關(guān)鍵詞排名優(yōu)化的效果。掌握好分析技術(shù),可以提高關(guān)鍵詞語(yǔ)搜索詞的匹配度,從而提高網(wǎng)站的排名,獲得精準(zhǔn)的流量。對(duì)于百度分詞,我們需要了解百度是怎么分詞,以

  • 策先生:淺談SEO中關(guān)鍵詞分詞技術(shù)

    背景資料:策先生策恩世界名鞋淘寶客推廣大賽特約評(píng)委曾于第一季推廣大賽期間對(duì)參賽選手表現(xiàn)進(jìn)行每周精簡(jiǎn)點(diǎn)評(píng),專治疑難雜癥,為一眾參賽選手所知曉。為人低調(diào)且神秘,專注網(wǎng)站推廣數(shù)年。現(xiàn)任第二季策恩世界名鞋淘寶客推廣大賽評(píng)委,行蹤不甚明朗。說(shuō)到中文分詞,我

  • 基于discuz在線分詞批量?jī)?yōu)化Dedecms文章關(guān)鍵詞

    這個(gè)小程序是基于discuz在線分詞批量更新已發(fā)內(nèi)容的keywords(tag),如果數(shù)據(jù)量大(大于5萬(wàn))的或者虛擬主機(jī)用戶的話,最好環(huán)境搭到本地。速度會(huì)快一點(diǎn)。

  • 關(guān)鍵詞分詞技術(shù):如何解決關(guān)鍵詞的解體拆用問(wèn)題

    我們并沒(méi)有過(guò)多的談?wù)撽P(guān)鍵詞的解體拆用問(wèn)題,它也不算是seo的某個(gè)特別明顯的特性。但是他對(duì)潛在的排名會(huì)有不利的影響。首先,我來(lái)告訴大家關(guān)鍵詞的解體拆用是如何發(fā)生的。當(dāng)一個(gè)網(wǎng)站的信息結(jié)構(gòu)需要一個(gè)單一的目標(biāo)條件或者一個(gè)要放在很多頁(yè)面的短語(yǔ)的時(shí)候,關(guān)鍵詞的解

熱門排行

信息推薦