HTTPS是以安全為目標(biāo)的HTTP通道,是HTTP的安全版,保證數(shù)據(jù)傳輸?shù)陌踩?,有效保障用戶隱私數(shù)據(jù),截取也無法解密。
?
HTTPS的收錄機(jī)制是什么?
一、蜘蛛如何發(fā)現(xiàn)HTTPS
1、網(wǎng)頁中出現(xiàn)的超鏈接是不是HTTPS,如果是HTTPS蜘蛛會(huì)認(rèn)為是HTTPS站點(diǎn)。
2、站長(zhǎng)平臺(tái)鏈接提交工具,比如主動(dòng)提交,文件中如果提交的是HTTPS的鏈接則以HTTPS的形式來發(fā)現(xiàn)。
3、參考抓取相對(duì)路徑,如果第一個(gè)網(wǎng)頁是HTTPS,網(wǎng)站里面的內(nèi)容路徑提供的也是相對(duì)路徑,認(rèn)為這種鏈接是HTTPS。
4、觀察歷史的鏈接,通過這種方式的原因主要是為了糾錯(cuò),如果提取HTTPS是錯(cuò)誤的會(huì)出現(xiàn)以下兩種情況:第一種,因?yàn)镠TTPS不可訪問導(dǎo)致抓取失敗。第二種,抓取成功但是可能會(huì)導(dǎo)致展現(xiàn)出來的效果不是站長(zhǎng)想要的。
二、HTTPS鏈接的抓取
鏈接的抓取有兩種:第一種HTTPS抓取,它沒有HTTP的版本。第二種是通過HTTP重定向到HTTPS。通過這兩種方式都是可以正常的進(jìn)行抓取,和HTTP抓取的效果是一樣的。
三、HTTPS的展現(xiàn)方式
HTTPS數(shù)據(jù),在展現(xiàn)端會(huì)有明顯的提示。
閱讀本文的人還可以閱讀:
HTTPS的工作原理,哪些網(wǎng)站適合使用HTTPS?
?
?
?
?
?
?
?
?
?