網(wǎng)站log日志有什么用?
網(wǎng)站log日志其實就是百度蜘蛛抓取的記錄。百度蜘蛛每來一次,并且都抓取了什么,哪類蜘蛛來進行抓取的,網(wǎng)站log日志都會記得非常清楚,我們可以獲取日志進行分析,百度蜘蛛今天都抓取了我們多少個頁面,其中哪些頁面沒有抓取成功等等,從而可以進行優(yōu)化我們的網(wǎng)站,使之更加符合網(wǎng)站SEO優(yōu)化。
在哪里可以獲取到log日志!
哪里可以獲取到log日志那?如果是linux+寶塔面板的主機環(huán)境,我們登錄寶塔linux面板后,點擊左側(cè)“文件”,在www下的wwwlogs目錄中就能看到網(wǎng)站訪問日志了。如果是虛擬空間,你可以去LOG目錄去查找,或者問下你的空間商即可。
網(wǎng)站log日志可以分析哪些數(shù)據(jù)!
1、查看目錄抓取概況
目錄抓取,可以清晰的查看到光顧網(wǎng)站的蜘蛛爬行過哪些目錄。要知道:有些目錄是沒有價值的,如一些圖標(biāo)目錄、下載目錄、留言目錄等,還有后臺目錄、數(shù)據(jù)庫,如果任由蜘蛛爬行,也是一種安全隱患。另外一方面,搜索引擎對于不同的站點都有著抓取配額,無用目錄,更不要占用這樣的配額,以免減少有效配額的抓取量。
2、查看頁面抓取概況
頁面抓取可以準(zhǔn)確的查看到蜘蛛爬行的每一個頁面,這也是對于LOG日志分析上非常重要的一個環(huán)節(jié)。如:多重URL鏈接的抓取?垃圾頁面的抓取?都是可以在其中展現(xiàn)出來的。甚至:某個頁面抓取頻率越高,通常代表這個頁面更有價值。
如果你想優(yōu)化的頁面,抓取頻率偏低,那么就要為其增加適當(dāng)?shù)钠毓舛?,來達成你想要的結(jié)果。
3、查看狀態(tài)碼信息
狀態(tài)碼分為兩種,一種是蜘蛛狀態(tài)碼,另一種是用戶狀態(tài)碼,通過蜘蛛狀態(tài)碼可以準(zhǔn)確的查看到網(wǎng)站是否存在抓取問題。例如:404代表的是錯誤頁,301、302代表的是重定向,還有一些:504、500、等狀態(tài)碼,值得說的是:除去200狀態(tài)碼,出現(xiàn)其他的狀態(tài)碼都是應(yīng)當(dāng)值得注意的,當(dāng)然,如果只是個別幾條則無需理會。但是如果數(shù)量一旦偏多,網(wǎng)站則100%出現(xiàn)問題了。
而用戶狀態(tài)碼,則代表用戶的訪問情況,在這其中可以清晰的看到用戶最為關(guān)注哪些頁面。不要認(rèn)為這是小事情,懂得營銷的站長,知道投其所好!
我們用什么工具去分析網(wǎng)站log日志?
分析百度日志工具有很多,比如“光年日志分析工具”或者“haolou在線分析”這邊給大家推薦一個好用的網(wǎng)站日志在線分析工具:“www.loghao.com”。大家將網(wǎng)站日志所有內(nèi)容復(fù)制粘貼到左側(cè),然后點擊分析按鈕,就能方便的查看搜索引擎爬蟲的爬取記錄了。是不是非常簡單那?
注意:網(wǎng)站log日志實戰(zhàn)要點總結(jié)!
1、如果想要更多有效的著陸頁被蜘蛛更多的抓取,那么請進行結(jié)構(gòu)內(nèi)鏈的完善。
2、不希望蜘蛛抓取那些沒有優(yōu)化意義的頁面上,那么robots.txt上來進行封閉。
3、“蜘蛛陷阱”無止盡的循環(huán),浪費抓取配額,通過頁面抓取,都可以直觀看到。
4、曝光力度夠了,蜘蛛一樣不抓取,只能說頁面價值太低,需要進一步優(yōu)化。
5、我們希望每個頁面的下載時間足夠快,可以在有效的時間內(nèi)抓取更多的頁面。
6、不是所有的蜘蛛都是真的蜘蛛,要學(xué)會查看蜘蛛是否為“采集”和“模擬”。
7、分析每天的蜘蛛,可以查看上升或者下降的趨勢,明顯變化,網(wǎng)站會出事的。
8、降低或者封禁不會帶來流量的蜘蛛,以減少服務(wù)器壓力,對大型網(wǎng)站很重要。
文章來源:代代SEO博客
來源地址:https://www.daidaiseo.com/seoti/551.html
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!