一直以來太多人在設(shè)置404頁面上都認為再簡單不過了,但實際上有太多的公司沒有合理、正確的設(shè)置404頁面。那設(shè)置404頁面到底都有哪些規(guī)則呢?下面趙彥剛和你一起討論下。
先補充說明一下什么是404頁面?在瀏覽器對網(wǎng)頁進行訪問時,當網(wǎng)頁發(fā)生相應(yīng)錯誤或不存在時,會提示404狀態(tài)碼,頁面會出現(xiàn)“Not Found”錯誤信息的提示。那提示信息的也是一個頁面,既稱為404頁面。
首先是否需要設(shè)置404頁面,需要先確定哪一類頁面返回的是404狀態(tài)碼,這點我們可以通過chinaz的http狀態(tài)碼查詢工具進行查詢(查詢地址:http://tool.chinaz.com/pagestatus/),如下圖:

那對應(yīng)返回的頁面,就是我們需要進行設(shè)置的。當我們沒有對該頁面進行設(shè)置的時候,服務(wù)器正常返回的頁面如下圖(之一):

那這不是正常返回404頁面了嗎?狀態(tài)碼也是404,為啥還要設(shè)置呢?怎么設(shè)置才算正確的呢?
第一:當用戶訪問了錯誤的頁面,會返回如上圖的404頁面,但沒有任何返回我們原網(wǎng)站的鏈接,會導(dǎo)致用戶的流失;第二:狀態(tài)碼設(shè)置不正確也會導(dǎo)致搜索引擎誤認為該頁面是可以正常訪問的,會導(dǎo)致搜索引擎爬蟲抓取到大量的空頁面或者重復(fù)頁面。
如下是幾種經(jīng)常容易出錯的例子:
一、不存在的頁面返回了200的結(jié)果:
如下圖,我的檢查結(jié)果,看圖中的這個URL就知道這個URL是不存在的。但查詢狀態(tài)碼還是返回200,這樣會導(dǎo)致爬蟲大量抓取這種頁面,并造成太多的無效頁面,甚至是垃圾、重復(fù)頁面。對網(wǎng)站的影響是很大的。

二、跳轉(zhuǎn)的404頁面
正常的404頁面返回結(jié)果是這樣的:當你訪問了錯誤頁面,URL是不會發(fā)生變化的,而網(wǎng)頁會直接出現(xiàn)我們設(shè)置好的404頁面。如下圖的流程。
訪問正常的URL地址:http://www.hqwx.com/record/?type=lesson&course_id=375。我們把后面的375改成37512312321232131。然后進行訪問發(fā)現(xiàn)如下結(jié)果:

發(fā)現(xiàn)我們設(shè)置好的404頁面確實是出來了,但url發(fā)生了跳轉(zhuǎn)。那我們看下這個跳轉(zhuǎn)的url是什么狀態(tài)碼。

返回狀態(tài)嗎不是404,那爬蟲豈不是就理解錯了!302是個臨時跳轉(zhuǎn)狀態(tài)碼。
三、未正確設(shè)置404頁面的情況

如上圖,訪問的URL沒變,但404頁面是這樣的。用戶看到了 可能會不明白是什么意思,同時,沒有返回網(wǎng)站的鏈接地址。也會導(dǎo)致用戶的流失。但爬蟲是沒問題的。
如上,是設(shè)置404頁面一些網(wǎng)站經(jīng)常忽略的問題。希望你知道了這個問題后,對自己網(wǎng)站進行排查。并進行正確的設(shè)置。如果對本文中存在問題,請在下方評論區(qū)進行評論回復(fù)。我們第一時間幫你解答。
也可以關(guān)注我的知識星球“優(yōu)啟學(xué)院”,來向我提問:https://t.zsxq.com/fIqJIAA
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!