我們建議在修改或更改域名時,將舊網頁301永久重定向到內容對應的新網頁,讓百度更容易發現這種變化,快速將舊網頁的累積權重轉移到對應的新網頁。
其他建議:
除非必要,否則不要完全替換整個站的內容。
當網站改版或網站中重要頁面的鏈接發生變化時,改版前的頁面301應永久重定向到改版後的相應頁面。
當壹個網站更改域名時,舊域名的所有頁面都應該永久重定向到新域名上的相應頁面。
網站更改域名後,舊域名可以盡可能長時間穩定訪問,讓用戶有更多時間記住新域名。
網站改版/域名變更後,請通過sitemap向百度提交新域名下的新網址/網址,幫助百度更快的查找並做出調整。
合理退貨代碼
百度爬蟲在抓取和處理時,根據http協議規範設置了相應的邏輯,所以請各位站長盡量參考http協議中返回代碼的定義。
百度蜘蛛對常用http返回碼的處理邏輯如下:
404
404返回代碼表示“未找到”。百度會認為該網頁無效,所以壹般會從搜索結果中刪除,短期內蜘蛛不會再抓取這個網址。
503
503返回碼的意思是“服務不可用”,百度會認為網頁暫時無法訪問,這種情況壹般發生在網站暫時關閉,帶寬有限的情況下。百度蜘蛛不會直接刪除這個網址,而是會在短時間內再次訪問。屆時,如果網頁已經恢復,將正常抓取;如果繼續回到503,短期內會訪問幾次。但是如果網頁長時間返回503,那麽這個網址還是會被百度認為是無效鏈接,從搜索結果中刪除。
403
403返回碼表示“禁止”,百度會認為該網頁當前禁止訪問。這種情況下,如果是新發現的網址,百度蜘蛛暫時不會抓取,短期內會再次檢查;如果百度已經收錄了網址,目前不會直接刪除,短期內會再次訪問。屆時,如果網頁允許訪問,將正常抓取;如果還是不允許訪問,短期內還會重復幾次。但如果網頁長時間返回403,百度也會將其視為無效鏈接,從搜索結果中刪除。
301
301的返回碼表示“永久移動”,百度會認為該網頁當前跳轉到新的網址。如遇站點遷移、域名變更、站點改版,建議使用301返回碼,盡量減少改版帶來的流量損失。雖然現在百度蜘蛛對301跳轉的響應周期比較長,但是我們還是建議妳這樣做。
我們建議:
如果網站暫時關閉,在網頁打不開的情況下,不要馬上返回404。建議使用503狀態。503可以告訴百度蜘蛛頁面暫時無法訪問,請過壹會兒再試。
如果百度蜘蛛給妳的站點壓力太大,請盡量不要用404,也建議回歸503。這樣過壹段時間百度蜘蛛就會再次嘗試抓取這個鏈接。如果當時站點閑置,就成功搶到了。
有些網站希望百度只收錄部分內容,比如經過審核的內容,壹段時間積累的新用戶頁面等等。在這種情況下,建議將新發布的內容暫時返回403,待審核或處理後再返回正常返回碼。
網站遷移或域名變更時,請使用301返回。
良好的秩序
覆蓋網頁主要內容的標題
網頁的標題用來告訴用戶和搜索引擎這個網頁的主要內容是什麽。搜索引擎在判斷網頁的內容權重時,標題是主要參考信息之壹。網頁標題是網頁上主要內容的總結,搜索引擎可以通過網頁標題快速判斷網頁的主題。每個網頁的內容都不壹樣,每個網頁都要有唯壹的標題。
我們建議網頁的標題可以描述如下:
首頁:網站名稱或網站名稱_提供服務介紹或產品介紹
頻道頁面:頻道名稱_網站名稱
文章頁面:文章標題_頻道名稱_網站名稱
標題引用html
推薦做法
每個頁面都應該有壹個唯壹的標題,並且所有的頁面都不應該使用默認的標題。
標題應該主題明確,包含本頁最重要的內容。
簡明扼要,不列出與網頁內容無關的信息。
用戶通常從左向右瀏覽,重要的內容要放在標題前面。
使用用戶熟悉的語言描述。如果妳有中英文網站名稱,盡量使用用戶熟悉的壹個作為標題描述。
好的內容建設