搜索引擎接收到用戶輸入的搜索詞后,需要對搜索詞做一些處理,才能進入排名過程。
搜索詞處理包括以下幾方面:
(1)中文分詞。與頁面索引時一樣,搜索詞也必須進行中文分詞,將查詢字符串轉換為以詞為基礎的關鍵詞組合。分詞原理與頁面分詞相同。
(2)指令的處置。平時咱們在搜索時會輸入多個詞語,實在默認的情況下,搜索引擎把多個默認的詞語都依照“與”來進行詞語。比方你搜索“seo”“培訓”時,搜索引擎會默認咱們輸入的“seo培訓”來進行處置,獨自包括“seo”或者“培訓”的網站內容實踐上將不會返回,但實際情況往往也會呈現(xiàn)獨自包括一個詞語的網站。另外,還要處置各種高等搜索指令的詞語,比方加號減號等。
(3)停止詞。和索引時一樣,搜索引擎也需要把搜索詞中的停止詞去掉,最大限度地提高排名相關性及效率。
(4)過錯糾正。用戶如果輸入了明顯錯誤的字或英文單詞拼錯,搜索引擎會提示用戶正確的用字或拼法。
(5)整合搜索觸發(fā)。某些搜索詞會觸發(fā)整合搜索,比如明星姓名就經常觸發(fā)圖片和視頻內容,當前的熱門話題又容易觸發(fā)資訊內容。