關(guān)于新建站點如何快速的被百度收錄,是很多SEOer在網(wǎng)站剛剛上線時最為關(guān)注的一個問題。并且收錄的快慢也成了領(lǐng)導(dǎo)頻繁追問的一件事,那如何通過使用百度鏈接提交工具快速的收錄我們的新站呢?今天我們請到了智聯(lián)招聘的SEO負(fù)責(zé)人-趙彥剛為大家分享他的心得!
在介紹鏈接提交工具之前,最先開始做的就是在百度站長平臺對新站點進(jìn)行驗證,只有驗證成功后我們才能使用百度站長平臺的鏈接提交工具以及其他的更多工具。驗證新站點的基本流程如下:
1、登錄百度站長平臺()后,選擇左側(cè)“我的網(wǎng)站”欄目目下的“站點管理”選項,然后右側(cè)點擊“增加網(wǎng)站”如下圖:
2、這時,跳到添加網(wǎng)站的環(huán)節(jié)中,分為兩步,一是輸入你新站的域名,再進(jìn)行對網(wǎng)站的驗證工作,如下:
上圖中,重點需要說明一下,如紅框中的文字,最好是驗證我們的主域名(像www.zhaopin.com這種)這樣后續(xù)再添加二級域名的時候直接選擇子鏈添加即可,不用再對網(wǎng)站進(jìn)行驗證。另外如果主域名是vip站點,該子域名也會繼承主域名的vip權(quán)限。否則就要單獨進(jìn)行驗證,也不會有這種vip權(quán)限繼承的能力。輸入主域名之后我們直接點擊下一步,選擇我們驗證網(wǎng)站的方式(文件驗證、HTML標(biāo)簽驗證、CNAME驗證),并按照說明部署到我們的站點,點擊驗證按鈕。
當(dāng)網(wǎng)站通過驗證之后,我們就可以使用鏈接提交工具了,目前鏈接提交工具分為自動提交和手動提交兩大塊,手動提交顧名思義自己手動復(fù)制粘貼去提交,相對簡單,我就不做過多說明。而自動提交中又分為:sitemap、主動推送、自動推送三種方式。三者都是將站點自身的URL自動推送至百度,而后等待百度爬蟲進(jìn)行對頁面的抓取。最終的目的是一樣的。如果對這三種自動推送的安裝方式不熟悉的話,可以參考該鏈接()進(jìn)行配置安裝。本文我重點聊一下三者的注意事項和區(qū)別:
Sitemap提交:在配置sitemap文件時,無論是txt格式的文本文檔還是還是xml格式的文件。都不建議將其sitemap的文件名命名為sitemap.txt或sitemap.xml這么大眾化且誰都能夠知道的文件名。如果你這樣設(shè)置,你的競爭對手或需要你網(wǎng)站內(nèi)容的人很容易就能拿到你所有的頁面url。出于保險起見還是使用一些自己定義的較復(fù)雜的文件名。每一個url都必須包含http://,文件中包含的url不得超過5萬條,單文件大小不得超過10MB,一個站點最多提交5萬個sitemap文件,超出5萬個不再處理并會提示“鏈接數(shù)超”。如果是通過子域名的形式驗證的站點。那么主域名下的sitemap文件是可以包含該域名下的所有域名的url的。
主動推送:對比sitemap而言在及時抓取上推送更快、發(fā)現(xiàn)更快、抓取更及時。如果是時效性文章不排除其收錄速度達(dá)到一瞬間的效率,這里特別建議一下,最好是主動推送我們網(wǎng)站第一時間產(chǎn)生的新內(nèi)容給百度其效果更佳;主動推送是有推送數(shù)量的限制,盡可能的不要推送重復(fù)的內(nèi)容給百度。這樣會大大浪費自己的可推送資源。
自動推送:是我們將一段js代碼部署到我們的每一個網(wǎng)頁中,當(dāng)有用戶進(jìn)行訪問時,觸發(fā)了這段代碼,這段代碼自動將當(dāng)前頁面的url推送給了百度。需要注意的是這段代碼無論是在PC站還是在移動站均可使用。是一個非常及時、便捷的輕量級鏈接推送工具。
在6月22日的時候,智聯(lián)招聘上線了一個新的站點。該站點實際上是在21日上線的。但由于還要線上調(diào)試,在21日是robots封禁了所有爬蟲的抓取。卻由于網(wǎng)站早在建設(shè)時就添加了自動推送的代碼,然后造成了21號上線,還沒有解禁爬蟲,百度爬蟲就來抓取了,并且收錄了首頁。如下圖(負(fù)責(zé)該站點的同事保留了截圖):
所以大家也看到了,由于自動推送的安裝,網(wǎng)站只要被訪問,立刻就推送給了百度,爬蟲第一時間抓取,然后快速收錄,這效率,還能有誰?
這只是第一天21號,然后在22號我們又將主動推送配置上了。然后其效果在百度站長工具的抓取頻次中是可以看到的,如下圖:
這是新站上線第二天,主動推送配置后的第二天,我們把事先準(zhǔn)備的內(nèi)容頁以及列表頁都利用主動推送一次性進(jìn)行了推送。然后上圖就是其明顯的效果了。當(dāng)然后續(xù)抓取的下降也是和我們每天發(fā)布的文章數(shù)量有直接關(guān)系。在6月28日又提交了sitemap,當(dāng)天的抓取如上圖結(jié)尾處,又漲了上來。下圖是爬蟲訪問sitemap所提取的url數(shù)量,其效果不明覺厲!
當(dāng)然,為什么三者建議一起使用呢?下面說下Sitemap、主動推送、自動推送的區(qū)別:
sitemap是一個可以容納大體量、歷史數(shù)據(jù)的容器。它將我們網(wǎng)站所有的url裝在了里面。個人覺得快速的抓取并不完全指望sitemap的提交方式,但對于已經(jīng)產(chǎn)生的文章、現(xiàn)有的列表頁、tag標(biāo)簽頁等都是最佳的選擇,當(dāng)我們的頁面發(fā)生變化時,主動推送并不一定會再次推送,因為畢竟主動推送承擔(dān)更多的是對新產(chǎn)生頁面的及時推送,最重要的是有最大推送數(shù)量的限制;再說自動推送。如果你對歷史頁面進(jìn)行了修改,沒有被訪問。那么根本不會觸發(fā)自動推送js代碼,當(dāng)然也就不會推送給百度。所以,歸其根本,sitemap是對已經(jīng)產(chǎn)生的文章頁、現(xiàn)有的列表頁、tag標(biāo)簽頁最大的助推工具。
主動推送,雖然有推送數(shù)量上的限制,但我們推送后的抓取速度已經(jīng)通過智聯(lián)招聘的新站例子很好的詮釋了。所以主動推送更多的應(yīng)該承擔(dān)對新產(chǎn)生的URL的及時推送作用。
自動推送,頁面被訪問了,就會被推送過去。那么被訪問的和沒被訪問的就是熱門頁面或冷門頁面的概念。冷門沒被訪問我們有sitemap,以及冷門頁面產(chǎn)生時的自動推送。但對于熱門頁面,用戶都喜歡的頁面而言。在搜索引擎上也會有很大的需求,這類頁面是我們獲得流量的重要頁面,他們?nèi)绻麤]有被收錄,除了sitemap、主動推送外,還可以更頻繁的利用自動推送進(jìn)行推送。這樣被抓取或者收錄的幾率又會大多少呢?而且這個相對sitemap和主動推送實現(xiàn)的成本更低些,加段代碼就搞定,何樂而不為呢?
所以,綜合上述的案例也好,三者的區(qū)別也罷。強烈建議你將其三個自動推送工具進(jìn)行安裝,并讓三者協(xié)同工作,將抓取和收錄價值最大化。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!