我在經營 SEO 顧問公司的數年經驗當中,體悟到一個滿重要的心得感想:就像你不必知道演算法怎麼寫成,也能用 Google 查好資料;你也不用參透複雜的 SEO 技術,就能做好 SEO。
把技術面做好,很重要的關鍵之一,就是要懂得「如何知道重要問題在哪、能和工程師有效溝通」。
在 SEO 領域裡,有許多對開發者來說就像「按開關」一樣簡單,但一按錯卻會把 SEO「全盤歸零」的重要設定。
類似這些恐怖地雷,就是在經營網站時要特別注意、要講究精準溝通的技術知識,才能讓危險的火藥變成開山建路的好工具。
以下是我整理 SEO 行銷初學者必備的【技術需知】,透過多次訪問技術工程師、盡量精煉出超級好懂的解釋方式,讓就算是沒基礎的人也能很快明白:為什麼這些知識對網站優化特別重要,以作為技術溝通與深度優化的知識橋樑。
【Crawler 爬蟲】
Google 就像蜘蛛一樣,會從一個網頁爬到下一個
Google 認識新網頁的過程,是派出一個爬蟲機器, 像蜘蛛一樣,從一個網頁爬到下一個。蜘蛛爬過的地方,就可以認識網頁在說什麼,沒有爬過的地方,Google 就不知道網頁上有什麼。
所以要知道:搜尋引擎不是用眼睛閱讀我們的內容,而是透過爬蟲認識網頁上的訊息。讓爬蟲有效的辨識頁面上的重要資訊,就是重點。
這個看似簡單的觀念,卻是做好技術 SEO、有效改善效率的關鍵環節。
【Crawling 爬文】
Google 蜘蛛不能認識沒爬過的網頁
蜘蛛沒有爬過的網頁,Google 就不會認識它,如果 Google 不認識一個網頁,那麼別人就不能透過 Google 搜尋到你的資訊。
所以,我們的任務就是確實的讓 Google 在自己的網頁上順利的爬文。
只要知道這件事情,就算不用涉入過多複雜技術,優化的效率也能大幅度提升;不知道的話,就像是死背單字一樣,記誦了許多複雜名詞、活用效果卻不好。
【Links 連結】
怎樣能讓蜘蛛最順利的爬文?
網頁和網頁之間的「連結」是讓 Google 順利爬文的關鍵。
它就像道路——有越多條路通向一個頁面,那麼 Google 的蜘蛛就越容易爬過去。
當 Google 蜘蛛越容易爬到你的頁面,它就越容易充分認識頁面上的內容。這樣一來,認識網頁的效率就會越好,每當網頁更新資料、累積排名訊號,Google 就會越容易處理,也能直接提升 SEO 的效果。
不要小看「連結」的重要性,這是 SEO 關鍵中的關鍵因素!
很多技術面上的改善優化,都離不開爬蟲與「連結」的相關配合。
【Navigation 連結架構】
網頁、連結越多越複雜,怎麼有效率的優化?
當網頁堆疊的越深,就需要越多連結才能讓 Google 蜘蛛順利的在網站裡面順利爬行。
當連結累積越多,整個網站裡的架構就會像蜘蛛網一樣:密密麻麻、錯綜複雜。你一定不希望蜘蛛困在半途爬不動,那怎樣才能讓它們爬得順暢呢?
重點優化關鍵:Navigation 連結架構
最重要的頁面,應該要有最多的連結可以通。
比如說首頁,它就像一棟房子的大門口,當訪客進站的時候,可以透過大門通向房子裡的每個房間,而房間也都有路可以走回大門,大門比起其他地方,是連結最多、最暢通的地方,這就是一個合理順暢的架構。
如果最重要的大門、最希望客人拜訪的地方,路卻是塞住的,或者沒有夠多的連結可以通過,那就是一個不好的架構。
連結架構對網站結構的優化非常重要,想要了解更多有關網站結構優化的資訊,可以參考這一篇【電商 SEO】9 個不用找工程師,小編就能做的官網結構優化技巧
越重要的頁面,就要有越多的連結通向它,這是時間一久就很容易忽略的優化項目。
【Orphan Page 孤兒頁】
無路可通的頁面
沒有任何連結可以通的頁面,被稱作「孤兒頁」。
孤兒頁會嚴重影響 Google 蜘蛛爬行的順暢度,也會使得 Google 非常難認識到頁面上的資訊。
記載重要內容的頁面,如果沒有連結通過,除了會有 SEO 的負面影響之外,也代表整體的連結架 構很可能出現了問題,才會讓「孤兒」產生,是需要花心思整理、改善的地方。
【Robots.txt】
不讓 Google 蜘蛛爬文的機器說明書
如果不想讓 Google 來爬文,該怎麼做?
會員資訊、顧客的消費紀錄 …… 這些東西都是不適合公開的,當然也不要讓陌生人可以隨便搜尋得到。
這時候只要設定網站的「機器守門員」,也就是 “Robots.txt”,就可以阻擋 Google 爬蟲進來拜訪。它也可以各別設定哪些頁面可以爬、哪些頁面不行。
但是,如果在正常運作的網頁,不小心把「機器守門員」設定錯誤,那麼整個網站的 SEO 成效就會全部歸零!
【Indexing 收錄】
Google 就像一大座圖書館,書本要先收錄,讀者才能借得到書
一本書需要先被收錄為「館藏」,讀者才有可能借得到。
網頁也是一樣:它需要先被搜尋引擎的蜘蛛爬文,接著被「收錄」進資料庫裡面,之後才會有排名、被其他人搜尋到的可能。
【Noindex】
書本不給借,圖書館就不能收
如果寫書的作者不希望圖書館把他的書借給別人,那麼圖書館不能把書本上架。
給搜尋引擎的類似功能,就是 “noindex” 標記。當工程師在網頁上採用這個設定之後,就代表我們禁止 Google 收錄這個網頁、也不應該讓其他人能夠查得到。
如果在正常運作的網頁,不小心把「noindex 標記」設定錯誤,那麼整個頁面的 SEO 成效就會全部歸零!