新聞動态
用(yòng)戶輸入關鍵詞進行檢索,百度搜索引擎在排序環節要做(zuò)兩方面的(de)事情: 第把相關的(de)網頁從索引庫中提取出來(lái);第二,把提取出來(lái)的(de)網頁按照(zhào)不同維度的(de)得(de)分(fēn)進行綜合排序。
“不同維度” 包括:
(1) 相關性。網頁内容與用(yòng)戶檢索需求的(de)匹配程度,如網頁包含的(de)用(yòng)戶檢查關鍵詞的(de)個(gè)數,以及這(zhè)些關鍵詞出現的(de)位置;外部網頁指向該頁面所用(yòng)的(de)錨文本等。
(2) 權威性。用(yòng)戶喜歡有一定權威性網站提供的(de)内容,相應地,百度搜索引擎也(yě)更相信優質權威站點提供的(de)内容。
(3) 時(shí)效性。時(shí)效性結果指的(de)是新出現的(de)網頁,且網頁内承載了(le)新鮮的(de)内容。目前,時(shí)效性結果在搜索引擎中日趨重要
(4) 重要性。網頁内容與用(yòng)戶檢查需求匹配的(de)重要程度或受歡迎程度。
(5) 豐富度。豐富度看似簡單,卻是一個(gè)覆蓋範圍非常廣的(de)命題,可(kě)以理(lǐ)解爲網頁内容豐富,可(kě)以完全滿足用(yòng)戶需求;也(yě)可(kě)以理(lǐ)解爲不僅可(kě)以滿足用(yòng)戶單一需求,還(hái)可(kě)以滿足用(yòng)戶的(de)延展需求。
(6) 受歡迎程度,指該網頁是不是受歡迎
以上便是百度搜索引擎決定搜索結果排序時(shí)考慮的(de)六大(dà)原則。那麽,六大(dà)原則的(de)側重點是怎樣的(de)呢(ne)? 哪個(gè)原則在實際應用(yòng)時(shí)占比最大(dà)呢(ne)? 其實,在這(zhè)裏沒有一個(gè)确切的(de)答(dá)案。在百度搜索引擎早期,這(zhè)些阈值的(de)确是相對(duì)固定的(de),如“相關性" 在整體排序中的(de)重量可(kě)以占到七成,但随著(zhe)互聯網的(de)不斷發展,檢索技術的(de)進步,網站建設數量的(de)爆發式增長(cháng),相關性已經不是難題。于是,百度搜索引擎引人(rén)了(le)機器學習(xí)機制,讓程序自動産出計算(suàn)公式,推進排序策略更加合理(lǐ)。
下(xià)一篇: 網站名稱及主題設計