什么是抓取異常?
指的是蜘蛛無(wú)法正常抓取頁(yè)面,網(wǎng)站出現(xiàn)抓取異常。
?
網(wǎng)站抓取異常的原因:
1、服務(wù)器異常
服務(wù)器連接異常最大的可能是網(wǎng)站服務(wù)器過大,超負(fù)荷運(yùn)轉(zhuǎn),通過檢查瀏覽器是否正常訪問。服務(wù)器異常會(huì)導(dǎo)致蜘蛛無(wú)法連接網(wǎng)站服務(wù)器,導(dǎo)致出現(xiàn)抓取失敗。
2、域名到期
域名過期網(wǎng)站肯定不能訪問,域名解析會(huì)失效,如果存在這類情況請(qǐng)與域名注冊(cè)商聯(lián)系。
3、網(wǎng)絡(luò)運(yùn)營(yíng)商異常
電信和聯(lián)通這兩種都是屬于網(wǎng)絡(luò)運(yùn)營(yíng)商,蜘蛛無(wú)法訪問的網(wǎng)站。
如果是因?yàn)榫W(wǎng)絡(luò)運(yùn)營(yíng)商出現(xiàn)問題,與網(wǎng)絡(luò)服務(wù)運(yùn)營(yíng)商聯(lián)系,或者空間或者購(gòu)買CDN服務(wù)。
3、robots.txt文件設(shè)置
robots.txt的功效主要是一些不重要的文件屏蔽掉告訴搜索引擎這些些頁(yè)面可以不抓取,可能會(huì)存在把重要的頁(yè)面也給屏蔽了,可以檢查下robots文件設(shè)置。
4、死鏈接
原本正常的鏈接后來(lái)失效了就是死鏈接,死鏈接發(fā)送請(qǐng)求時(shí),服務(wù)器返回404錯(cuò)誤頁(yè)面。
死鏈的處理方案可以通過百度站長(zhǎng)平臺(tái)提交死鏈文件。具體的操作方法文章(為什么要使用死鏈工具?死鏈工具的使用方法)
5、網(wǎng)站被掛馬
網(wǎng)站被掛馬,要查詢掛馬文件在哪里并刪除,恢復(fù)網(wǎng)站,更改登錄名和密碼,安全密保要從新設(shè)置,防止下次被掛馬。
?
如果網(wǎng)站出現(xiàn)抓取異常的現(xiàn)象,訪問網(wǎng)站的用戶沒有得到想要的東西,用戶的體驗(yàn)感就會(huì)下降,搜索引擎對(duì)網(wǎng)站的評(píng)價(jià)降低。
閱讀本文的人還可以閱讀: