搜尋引擎 (Search Engine) 是什麼?為什麼大家只討論 Google 搜尋引擎?

搜尋引擎的英文是 “Search Engine”,是一種幫助搜尋者查資料的系統

搜尋者在搜尋引擎欄位輸入「關鍵字」,即可找到資料。

要上網找資料時,很多人第一個先想到的總是 Google,而搜尋影片最有名的平台就是 Youtube 了。如果在美國上網買東西,亞馬遜 Amazon 往往就是第一首選。

Google、Youtube、Amazon 這些都是非常知名的搜尋引擎 (Search Engine)。

不過,在主流的 SEO 操作領域當中,討論搜尋引擎時幾乎都只會關心 Google

因為 Google 是目前市佔率最大、也是最重要的搜尋引擎

台灣搜尋引擎市佔率 (2020/07) 資料來源:https://www.statista.com/

以台灣的搜尋引擎市佔率來看,Bing、Yahoo 等搜尋引擎因為加總起來也連 Google 的十分之一都不到,所以比較少被提及;

至於 Amazon、Youtube 因為有各自獨立的商業生態,所以 SEO 也是各自分開討論,而且會特別強調是 “Youtube SEO”、”Amazon SEO” 等,不會併在一般的 SEO 主題討論。

以下介紹世界七大受歡迎搜尋引擎

  • Google:Google 的市佔率已高達 86%,是最多人使用的搜尋引擎,因此若想獲得流量,絕對不可忽略 Google。

    但同時也代表競爭激烈,不管是用 SEO 提高流量或是刊登付費廣告,都要面對相當程度的競爭。
  • Youtube:創立隔年就被 Google 收購的影音平台,每月有超過 15 億用戶登入使用,因此能透過 Youtube 影片吸引的流量十分可觀。

    但 Youtube 所使用的演算法和 Google 不同,所以操作 SEO 的手法也不同。
  • Amazon:從網路書店起家,至今已成為網購龍頭。

    根據統計,有一半以上的網購搜尋,是都直接在 Amazon 開始的。
  • Facebook:乍聽之下,知名社群網站 Facebook 和搜尋引擎關係不大,但 2017 年的官方統計資料指出,每天有約 20 億次的搜尋發生在 Facebook。
  • Microsoft Bing:使用者雖然沒有 Google 多,但在美國和英國的市佔率算高,因此仍有一定影響力。也因為演算法比 Google 單純,相對容易優化,較容易提升排名。
  • Baidu(百度):市場大但卻單一,僅限於中國,因此目標若是中國使用者,百度的排名重要性會遠高於 Google。
  • Yandex:在俄羅斯有較高的市佔率(甚至超越 Google),演算法相對於 Google 較為簡單,但卻設有一些不利境外者的規則,比如針對地理位置賦予較高的權重,所以使用者會優先得到與所在位置相符合的結果。

搜尋引擎 (Search Engine) 的運作原理?和 SEO 的關係?

要了解搜尋引擎優化,就要先了解它的核心:搜尋引擎。

了解搜尋引擎如何運作之後才能有方向、有計畫的執行優化,也才能知道「優化」的目的是什麼。

搜尋引擎的運作主要可以分成以下三大部分:

  1. 爬文 (Crawling)
     
  2. 收錄 (Indexing)
     
  3. 排名 (Ranking)

爬文 (Crawling)

Google 會使用網路爬蟲 (Crawler),或稱爬文蜘蛛 (Spider) 在網際網路上爬文、收集資料。

爬文蜘蛛會透過網頁和網頁之間的連結探索新的網頁,並且不斷重複使用同樣手法進一步擴張和抓取更多資料。

經過整理分類、最後在搜尋結果中呈現給使用者。

這讓 Google 成為巨大網際網路世界裡最好的資料查詢導航。

截圖來源:Google —— 搜尋引擎如何運作?

爬文額度:”Crawl Budget” 是什麼?

搜尋引擎「爬文」會耗費運算資源。

所以,搜尋引擎其實有「爬文額度」(Crawl Budget) 的限制。

一個網站如果擁有比較多的 “Crawl Budget”,就表示它可以常常被爬文蜘蛛造訪。

每當有新的文章、或者舊文章更動的時候,這些訊號和資訊就可以迅速被搜尋引擎更新、提升排名的效率。

相反的,缺少爬文額度的網站,新的文章可能遲遲都不會被 Google 找到,自然在排名上也就比較辛苦。

網站怎麼樣才能取得更高的爬文額度?

一般來說,Google 會優先從高權威性的網頁開始爬文,並且會頻繁的回訪、探查這些高權重的網頁是否更新。

所以,每當大型、知名的新聞媒體發文時,它們的文章常常可以很快的排在搜尋結果最前面,主要就是這個原因。

Google 也優先探索擁有比較多反向連結 (Backlinks) 的網頁,因為爬文蜘蛛就是透過網頁和網頁之間的連結來查找最新的內容。

當新文章發佈、或網頁更新的時候,Google 就是透過爬文來認識新內容,並且為它安排適當的排名位置。

因此,想辦法讓自己的網頁頻繁的被 Google 爬文,也是 SEO 們努力的重要目標。

由於爬文額度 (Crawl Budget) 的限制,全新開張的網站、沒有足夠連結的網頁、或是很久不更新的文章,往往要等待比較久才能夠被 Google 的爬文蜘蛛找到

這也是為什麼全新網頁、沒有人連結的網頁,總是要等好久才能看到明顯 SEO 成效的原因:

因為 Google 還沒有來爬文,自然就沒辦法認識、收錄網頁內容,網頁也就很難顯示在 Google 的搜尋結果頁面了。

自家網站的官方爬文數據(透過 Google Search Console 查詢)

收錄、索引 (Indexing)

當爬文蜘蛛把抓取到的資料傳回 Google 伺服器後,Google 會進一步建立「搜尋索引」(Search Index),將資料收錄進 Google 的資料庫裡進行管理、分類。

要注意的是,有經過收錄的內容,才能在 Google 上被找到。

Google 的收錄速度快嗎?要等多久?

根據 Google 官方論壇的最佳回覆,網頁被收錄的速度與新網頁本身的狀況有關,沒有一定的標準時程

但新網頁被收錄的時間通常會落在四天到四週之間,有時候還可能更長。

官方回覆也列舉了一些影響網頁收錄速度的因素,像是:

  • 網頁的受歡迎程度:擁有較多反向連結、被許多網頁以連結引用的網頁,收錄的速度往往較快。
  • 網頁內容是否可被爬文蜘蛛爬取:這可以從伺服器的回應狀態確認。

    像是 “404” 指 “Not Found” 請求失敗,如果爬蟲看到這樣的失效狀態,那麼它可能就會把運算資源改移到其他地方、延緩被爬文的速度。

    另外,爬文蜘蛛基本上還是以「文字理解」為主,如果網頁上重要的資料是用影片、圖片、音檔等類型乘載,那就必須確認是否有對應的文字描述內容,才能對爬蟲友善。
  • 網頁架構:爬文蜘蛛透過「網頁和網頁之間的連結」認識新的網頁,所以新網頁和其他網頁間的連結也就可能會影響到收錄的狀況。

    SEO 大師 Neil Patel 認為:網頁架構是很重要、但卻常被忽略的 SEO 優化項目

    網站架構通常不會只有一個層級,因此確保網頁層級不要太多,且重要資訊不要被放在太下層的頁面,並適時加入內部連結以加強網頁彼此的連結,都是有助於爬文蜘蛛爬取內容的方式。

如何確認網頁是否已經被 Google 收錄?

最快速的方式,是在搜尋欄位當中輸入:

關鍵字 site:自己的網域.com

如果看到搜尋結果有出現自己的網頁,就可以確認它已經被 Google 成功收錄了。

使用 Google Search Console 確認網頁收錄情況 

最正式的方法,是使用 Google Console Search 中來確認網頁的收錄情形。

方法如下:

  • 點選「網址審查」
     
  • 輸入想要確認的頁面網址 (URL)
     
  • 從「檢查網址」的介面中查看收錄情況

如果畫面中有出現綠色勾勾、「網址在 Google 服務中」的字樣,那就代表頁面已經有成功被收錄。

主動要求 Google 收錄自己的網頁

網頁遲遲不被 Google 收錄,該怎麼辦?

有時候我們新發佈了一篇文章、或者在原本的文章做了大翻新,但是 Google 還沒有前來確認,那我們還可以自己向 Google 提出申請、主動要求 Google 收錄網站。

手動提出申請的方式有兩種:

  1. 使用 Google Search Console 裡的 “the URL Inspection Tool”(網址審查)提出請求,或是
     
  2. 提交 “Sitemap”

在 Google Search Console 裡的「網址審查」欄位中輸入頁面網址,如果審查結果顯示「網址不在 Google 服務中」,可以按右下角「要求建立索引」。

這時候系統就會顯示「編入索引」的相關字樣,等測試結束,就完成收錄的要求了。

另一個提交收錄請求的方法:提交 “Sitemap”

除了在 Google Search Console 網址審查提出請求以外,還可以透過提交 Sitemap 的方式傳達請求訊息給 Google。

Sitemap 是個檔案,就像地圖一樣能告訴 Google 你的網站網頁彼此間的關係,以及其他補充資訊,讓 Google 更了解你的網站,Google 便能因此更明確知道如何收錄你的網站。

Google官方表示,網站規模龐大、網站所含網頁多於 500 頁的話,可能需要使用 Sitemap;

或是網頁各自獨立、彼此間沒有連結時,也可能需要使用 Sitemap 告訴 Google 彼此的關係;

又或者像是新聞網站一樣常有新網頁或需要頻繁更新內容,也可能會需要使用 Sitemap 來告知 Google 網頁更新的時間。

相反的,如果網站規模小、網站所含網頁少於 500 頁,或是網站架構完整、內部連結完善,爬文蜘蛛能輕易透過連結,從首頁爬取至所有重要網頁,可能就不需要使用 Sitemap

排名 (Ranking)

當 Google 完成爬文、收錄之後,就會開始試著將網頁內容排在搜尋結果的適當位置。

而使用者搜尋關鍵字詞的時候,Google 會從龐大搜尋資料庫中提供使用者最具價值的資訊。

排名的依據:演算法

為了避免 SEO、或其他使用者使用作弊的方式操縱排名、把不適合或品質低劣的網頁排在不洽當的位置,Google 使用非常複雜的排名演算法,考慮非常多的因素、綜合一起決定排名。

最終目的就是要提供最有價值的搜尋結果給使用者

搜尋引擎的排名速度

原則上,平均時間大概在 48 小時到半年以上不等。

如果你搜尋「關鍵字排第一要多久」,可能會看到我們 JKL 團隊實測整理的結果。

搜尋引擎最佳化是一項非常需要耐心的技術。

而網頁排上搜尋結果第一頁的影響因素太多,所以非常難下定論。

影響因素太多了,包括網站本身原有的權威強度、關鍵字的競爭程度等,都可能會影響文章的排名表現。

根據 SEO 權威網站 Ahrefs 的統計分析資料,搜尋結果第一頁上的文章,大部分都花了 2-6 個月才排上第一頁。

但也有文章發佈後沒幾天就排上第一名的極端案例

如果實際查看搜尋結果頁面上文章的「年齡」(文章發佈多久),可以發現第一頁半數以上多充斥著 3 歲以上的文章,1 歲以內的「年輕」文章約只佔 22%,可見排名成效需要花費一定的時間長度。

影響排名的因素

會影響搜尋引擎排名結果的因素究竟是什麼?

Google 搜尋演算法有詳盡規定會影響關鍵字排名的因素。

根據 Backlinko 整理的清單,會影響關鍵字排名的因素有 200 項之多。

不過,根據 Google 官方說法,大致可以分成以下五個類別:

  • 分析搜尋字詞
  • 比對搜尋查詢
  • 為實用的關鍵字排名
  • 傳回最實用的搜尋結果
  • 考量背景資訊
分析搜尋字詞:關鍵字要讓人和 Google 都能懂 

當使用者鍵入關鍵字,搜尋引擎會先分析關鍵字所蘊含的意義。

Google 利用其演算法「理解」這個詞的意思後,再決定要在網路這個大千世界裡,抓出哪些與此字詞有所相關的資料。

Google 官方表示,即便同一個詞有多種可能的意義, Google也能用其同義字系統判讀出最適合的結果,這也是 RankBrain 演算法的核心內容。

不過事實上,脫離 Google 演算法原生的英文市場,來到台灣的繁體中文市場,Google 針對同義字判讀出的搜尋結果似乎就不是那麼精準了。

例如:想知道「代購這個詞是什麼意思」,使用者可能會用「代購是什麼」和「代購的意思」這兩個不一樣的關鍵字搜尋答案。

但實際用這兩個關鍵字搜尋,得到的搜尋結果無論是在內容和數量都不盡相同,像是前三名中就只有一個網站同時出現在兩個關鍵字的搜尋結果。

比對搜尋查詢:關鍵字出現的位置和頻率 & 是否確實有相關內容

那麼, Google 如何判斷,哪些資料是與關鍵字有所相關呢?最基本的是網站裡有包含關鍵字,例如在標題或內文裡有出現該字詞。

搜尋引擎將分析關鍵字出現在網頁上的頻率及位置,藉以判斷相關程度。

不過,雖然關鍵字出現與否及出現頻率很重要,但這並不是搜尋引擎將網站納入相關資料群的唯一原因。

還有另一項同樣舉足輕重的因素:內容相關程度。搜尋引擎分析關鍵字之餘,也會判讀網站內容的意涵是否與該字詞實質相關。

例如,當搜尋「狗」時,狗的品種起源、狗的行為指南或狗狗旅館、狗狗美容等內容意義上與「狗」有關的網站會出現在搜尋結果;

一個只是寫滿一堆「狗狗狗」的文字、沒有為使用者提供實際資訊的網頁則不會被列入排名中。

為實用的關鍵字排名:內容決定一切 

從上述搜尋「狗」的例子可以發現, Google 判讀網站內容的核心指標在於這個網頁對搜尋者來說是否實用、是否幫助搜尋者獲得有用的資訊。

因此,除了意涵必須與關鍵字有所關聯外,內容更新時間、良好的使用者體驗等亦是評判的標準之一。

此外,網站內容的可信度與權威性也是一大重點。

如果其他經營相關主題的知名網站,有連到此網頁的連結,就像是為這個網頁「背書」一般,Google 將判定此網頁確實擁有可靠且優質的實用內容。

例如:聯合新聞網的運動專欄轉發 JKL 的按摩槍文章,而且有加入刊載原文的網頁網址,就是認定這篇文章的內容優質,肯為其背書的意思。

傳回最實用的搜尋結果:讓所有使用者都能檢視的結果 

對 Google 而言,判別一個網站的實用性,除了關鍵字出現頻率、內容相關性與品質外,亦會考量對所有使用者來說、由此網站取得資訊的容易度與方便性。

例如,網頁是否支援不同的瀏覽器、網頁是否在所有瀏覽裝置(桌機、筆電、手機、平板等)都可以順利觀看、載入速度是否太慢等。

考量背景資訊:考量目標客群的所在地 

為了確保搜尋引擎找出的資訊對使用者來說是最有幫助的,在呈現搜尋結果時, Google 將優先顯示搜尋者所在地相關的內容。


© 2023