針對(duì)404頁面,lee列舉了兩類情形,一是網(wǎng)頁姑且性打不開;二是,頁面永遠(yuǎn)無法打開。針對(duì)第一類問題,建議不要馬上返回404,而是使用503。針對(duì)第二類問題,永遠(yuǎn)無法打開的頁面,404,不用考慮。各類web2類頁面刪除后同樣需要返回404奉告搜索引擎該頁面已失蹤效。
文檔具體內(nèi)容:
今天為什么要說一下404問題呢,比來看case過程中發(fā)現(xiàn)個(gè)很有意思的網(wǎng)站,該網(wǎng)站被灌了年夜量的垃圾信息,被其發(fā)現(xiàn)后實(shí)時(shí)地進(jìn)行了刪除,這一點(diǎn)是值得必定的。凡是情形下,正常網(wǎng)站將自動(dòng)返回404狀況碼,搜索引擎進(jìn)行更新并刪除,避免對(duì)網(wǎng)站用戶及搜索引擎帶來負(fù)面影響。但問題來了,該網(wǎng)站只刪除了內(nèi)容,沒有任何主體內(nèi)容的頁面被保留了下來,未做404措置。當(dāng)然,存在一類網(wǎng)站只刪除內(nèi)容后返回正常200狀況碼,提醒一句“該內(nèi)容已刪除”,但其都沒有�?梢园l(fā)現(xiàn)今朝這個(gè)搜藏中的url仍然正常返回200,http://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的后不美觀:搜索引擎將破耗年夜量的資本在這種無效頁面上,那么,齊截耗損下用在主要頁面上的資本將被年夜量擠占,可想而知,正常優(yōu)質(zhì)頁面在搜索引擎的部門默示將受到影響。經(jīng)由我們運(yùn)營同窗的多方溝通下至今仍未進(jìn)一步措置。我感受,21世紀(jì)第二個(gè)十年了,這種問題不應(yīng)該再存在了的。
站長網(wǎng)(www.admin5.com)5月6日動(dòng)靜,今日百度站長平臺(tái)lee發(fā)布了一篇文檔,在文中談到了網(wǎng)站404頁面臨于搜索引擎收錄的影響。lee暗示沒有任何主體內(nèi)容并未做404措置的頁面,搜索引擎將破耗年夜量的資本在這種無效頁面上,齊截耗損下用在主要頁面上的資本將被年夜量擠占,正常優(yōu)質(zhì)頁面在搜索引擎的部門默示將受到影響。lee建議刪除內(nèi)容后沒有任何價(jià)值的頁面直接做死鏈措置并返回404,并在百度站長平臺(tái)死鏈提交工具中提交死鏈sitemap。
好吧,認(rèn)可我被打敗了。簡單說一下:
404狀況碼代表‘Not Found’,spider更新時(shí)會(huì)認(rèn)為該頁面已失蹤效,此時(shí)呢將在索引庫中刪除,短期內(nèi)spider再次發(fā)現(xiàn)該url不再會(huì)抓取。是以,出來了兩類問題:第一,網(wǎng)頁姑且性打不開;第二,頁面永遠(yuǎn)無法打開。針對(duì)第一類問題,我建議不要馬上返回404,而是使用503。503等同于告訴spider該頁面姑且訪謁不了,過段時(shí)刻再來惠臨。關(guān)于503,spider會(huì)認(rèn)為該網(wǎng)頁姑且無法訪謁,短期內(nèi)會(huì)再惠臨。如不美觀網(wǎng)頁已經(jīng)恢復(fù),即刻正常抓取;如不美觀繼續(xù)返回503,短期內(nèi)還會(huì)再惠臨幾回,但如不美觀該頁面長時(shí)刻返回503,該url仍會(huì)被認(rèn)作失蹤效鏈接,年夜索引庫中刪除。針對(duì)第二類問題,永遠(yuǎn)無法打開的頁面,404,不用考慮。各類web2類頁面刪除后同樣需要返回404奉告搜索引擎該頁面已失蹤效。
回歸之前阿誰網(wǎng)站,刪除內(nèi)容后該頁面沒有任何價(jià)值。最適當(dāng)?shù)拇胫檬牵?/strong>
1、直接做死鏈措置并返回404;
最后呢,提醒一下列位站長伴侶,當(dāng)您的網(wǎng)站存在被發(fā)布年夜量垃圾信息時(shí),請(qǐng):
2、在百度站長平臺(tái)死鏈提交工具中提交死鏈sitemap。
2、建造合適要求的死鏈sitemap;
3、登錄百度站長平臺(tái),進(jìn)入死鏈提交工具提交死鏈sitemap。
1、實(shí)時(shí)刪除相關(guān)垃圾頁面,并做404措置;
相關(guān)閱讀:百度外鏈判定尺度文檔發(fā)布 闡述問題外鏈判定和措置原則