1,頁面制作完成后再放到spider可以發(fā)現(xiàn)的地方,這樣才能達(dá)到最好的抓取效果。
2,頁面未對(duì)外公開之前,千萬不要通過工具推送給百度呀。
接到站長(zhǎng)反饋后,院長(zhǎng)聯(lián)系了spider工程師,工程師在后臺(tái)查詢了這些未收錄的鏈接,發(fā)現(xiàn)均顯示為“死鏈”,然而這些所謂的死鏈現(xiàn)在訪問都是好好的。根據(jù)后臺(tái)顯示的抓取時(shí)間,院長(zhǎng)反復(fù)和站點(diǎn)進(jìn)行溝通,終于找到了根源:原來,站點(diǎn)為了搶新聞,提前制作了新聞稿并制作成鏈接并且發(fā)布,雖然沒有在首頁等重要頁面推送給用戶,但卻被BaiduSpider發(fā)現(xiàn),更重要的是,這些鏈接向BaiduSpider返回的狀態(tài)碼是404。
舉個(gè)例子,中國(guó)女排進(jìn)入決賽后,某網(wǎng)站做了A和B兩個(gè)頁面,分別為奪冠和摘銀,為了防止用戶在比賽結(jié)束之前閱讀到頁面內(nèi)容,站點(diǎn)將兩個(gè)鏈接都設(shè)置為404!404?。ǖ鹊奖荣惤Y(jié)束后,再將其中一個(gè)頁面的html返回碼改為200)。雖然頁面并沒有向用戶推送,但還是被聰明的BaiduSpider發(fā)現(xiàn)。然而這里的問題是,BaiduSpider發(fā)現(xiàn)頁面是404,又無法判斷出這是一個(gè)重要頁面,于是直接打入冷宮不再理睬。 所以,學(xué)院反復(fù)強(qiáng)調(diào),確認(rèn)頁面真的不需要被搜索引擎保留時(shí)可以使用404(臨時(shí)閉站可使用百度站長(zhǎng)平臺(tái)的閉站保護(hù)工具),如果還希望和搜索引擎保持友好關(guān)系的話,請(qǐng)使用503,防止頁面被刪除。雖然Baidu有對(duì)高價(jià)值內(nèi)容的“刪除保護(hù)”功能,但畢竟不是每個(gè)站點(diǎn)都可以享受到這個(gè)特權(quán)的。 |
- 07-19[網(wǎng)站運(yùn)營(yíng)] 網(wǎng)站運(yùn)營(yíng),如何做好網(wǎng)站體驗(yàn)優(yōu)化
- 05-22[網(wǎng)站運(yùn)營(yíng)] 網(wǎng)站分析如何做?
- 03-21[網(wǎng)站運(yùn)營(yíng)] [媒體人的一天]新華網(wǎng)李洪雷:網(wǎng)站
- 03-16[人物訪談] 訪談李勇:SEO博客兩個(gè)多月快速提
- 02-06[人物訪談] SEO訪談:初入SEO的苦與樂!seo有沒有
- 02-04[自媒體] 內(nèi)容創(chuàng)業(yè)時(shí)代來臨:機(jī)會(huì)、趨勢(shì)、
- 01-13[網(wǎng)站運(yùn)營(yíng)] 網(wǎng)站運(yùn)營(yíng)推廣成功的三大核心問題
- 01-10[自媒體] 內(nèi)容創(chuàng)業(yè):前景光明還是黑暗?
- 03-16[網(wǎng)站運(yùn)營(yíng)] 網(wǎng)站運(yùn)營(yíng)之變局-內(nèi)容為王的時(shí)代已