技術專欄

集結國內外精選文章,掌握最新雲端技術新知與應用 

iKala Cloud / 部落格 / 產業解決方案 / 電商 Shopify 如何利用 Google Cloud 迎戰購物節帶來的高流量

電商 Shopify 如何利用 Google Cloud 迎戰購物節帶來的高流量

Google Cloud 和來自不同產業的企業合作,我們觀察到當企業的線上服務流量激增時,會經歷高峰狀況。對於零售商來說,高峰狀況發生在 Black Friday 和 Cyber Monday (或 BFCM) — 美國感恩節後的購物節,是 11 月和 12 月重要的假期購物季,估計收益可以高達全年零售額的 20%

根據 CNET 的報導,美國每天的線上零售總額平均約為 14 億美元。相較之下, 2018 年的 Black Friday 的線上銷售總額為 62.2 億美元(比 2017 年成長 24% )。根據  Adobe Analytics 的數據,2018 年的 Cyber Monday 銷售額激增至 79 億美元(比 2017 年成長 19 %),是美國史上最大的線上銷售日。

購物季帶來遠超出平日的流量,對零售商的購物應用程式帶來可用性和擴展性的問題,這些問題可能導致數百萬美元的損失。每年都會有知名的零售網站因為流量過多導致服務斷線,因此對零售商而言,確保服務不會停機是相當重要的(服務停機會損失企業聲譽,也會造成顧客的不滿和 IT 團隊的壓力)。

我們知道堅實的技術基礎設施在購物旺季對零售商而言是保持領先和成功的重要基礎。除此之外,背後的支援也相當重要。支援不僅是當問題發生時的立即處理,對於像是 Black Friday 和 Cyber Monday 這樣大型的購物節,支援更包含了事前完善的準備、測試、架構檢測、容量規劃、營運演練以及活動期間的戰情室。對 BFCM 的支援,我們採取規範性方法,從零售商和開發團隊的角度,儘早設定客戶期望和彼此的權責劃分(提前超過 6 個月),以了解每個零售商客戶的需求。

我們將透過一系列步驟,幫助我們的零售商客戶實現一個沒有災難且獲利亮眼的購物季。這些步驟能幫助您爲自己的高峰狀況做好準備。此外,我們將會以一個大型的購物平台— Shopify 為例,介紹如何利用 Google Cloud 實現成功的 BFCM。

為 Black Friday 和 Cyber Monday 的前期準備

我們在 2018 年的春天開始爲我們的零售商客戶規劃 Black Friday 和 Cyber Monday,以符合他們例行的準備時程。我們組成了一個專門的工作小組,包含來自 Google Cloud 專業服務、顧客工程、支援顧客可靠性工程 (CRE)、產品及工程團隊的代表。我們定期召開會議,制定策略並執行,以確保 Google 團隊成員和我們的 GCP 零售客戶做好充分的準備。

我們專注在幾項關鍵技術領域,規劃以防止問題發生。

  1. 儘早規劃容量

早在 2018 年 5 月,我們的客戶團隊就開始接觸 GCP 的零售商客戶。我們在較高的層次進行了討論,像是特定的假期購物業務目標,以及 協助實現這些目標所需要的基礎設施規模。

處理高負載流量,系統的擴展性是至關重要的,我們和零售商密切合作,以便檢視他們的架構,並在 Black Friday 前就針對規劃容量增加的技術給予建議。我們針對團隊、服務以及壓力測試系統進行測試,以檢視是否有任何限制和弱點,並根據需求進行修復。這些量身定制的準備帶來全局的綜效。由於 GCP 的容量狀態在整個 Black Friday 和 Cyber Monday 呈現綠色—可用,拜訪我們零售商客戶網站的消費者可以順利進行消費,免於網站服務緩慢和無回應等惱人的情況。

2.可靠性測試

事先檢測 ( CRE 的重要部分之一 ) 是我們採取的另一個優先步驟,以識別潛在的可靠性問題。我們的 CRE 團隊很早就開始與我們的零售商客戶合作,去分析他們基礎設的可靠性,並透過沙盤推演,了解客戶是否已預備充足,以面對服務失敗的情況。在某些情況下,專業服務團隊會幫忙執行負載測試,以確保零售商的平台可以應付預期的流量高峰,而其他情況我們則鼓勵定期執行負載測試和評估。此外,有鑑於行動商務的重要性,我們也會測試客戶行動應用程式的表現和可靠性。同時,我們亦採用 Apigee 的 API 監測 工具,確保 API 的穩定性。我們觀察到在零售技術中, API 變得越來越重要,因為 API 能讓電商網站利用微服務概念開發,變得更有彈性。

3.營運戰情室

「什麼環節可能出錯?」

這是在一個大型 IT 活動前需要被討論的、價值數百萬美元的問題。我們與零售商客戶的 IT 和工程團隊一同探索和測試所有可能發生的最壞情況,像是網站整個當機。我們爲 Black Friday 和 Cyber Monday 組織了一個中央戰情室,由來自專業服務、支援、網站可靠性工程團隊富有經驗、資深的 Google 員工所組成。這個第一線支援團隊會以即時通訊的方式與我們的零售商客戶保持連線,並在問題出現時立即解決。除此之外,還需了解客戶和供應商的整合,確保提前定義呈報途徑,如此才能明確釐清各個整合環節的客戶期望。

在那個週末,我們加倍待命支援人員的數量,確保零售商客戶可以即時與我們聯繫。在某些狀況下,我們會在 GCP 和 Apigee 零售商客戶位置安排客戶團隊,以便根據需要提供協助。我們監控是否有任何零售商客戶遇到可靠性或延遲問題。如果需要對問題進行診斷,戰情團隊會立即採取行動、處理問題,並針對後續步驟給予建議。 此外,Google 戰情團隊可以直接且開放地與 Google 的工程師和管理人員聯繫,以獲得更多的支援。

在 Black Friday 期間,Apigee 團隊的成員會密切關注 API 的流量。與 2017 年同期相比,Apigee 客戶(不包含將平台建置在本地端的客戶)的 API 呼叫數量成長了 95 %。透過 Apigee 運行的 API 流量高峰增加了一倍以上,今年從每秒 48,000 個交易 (TPS) 到每秒 108,000 個交易,平台仍然維持 99.999% 的可用性。

零售商如何順利挺過 Black Friday 和 Cyber Monday

Shopify 是我們的零售夥伴之一,是一個支援超過 600,000 個獨立零售商的電商平台。同時管理所有零售店面的複雜性使得預測假期的網站流量和銷售高峰變得更加困難。Shopify 電商平台提供 99.98% 的正常運行率,並將 BFCM 稱為年度 ‘’世界杯’’ 活動。


資料來源

Shopify 平台是由許多內部服務和第三方供應商的服務所組成,像是支付服務以及物流。這些服務彼此相互依賴,因此每個服務都必須要是可靠的,平台才能在 BFCM 期間順利運行。

在 2017 年的 Black Friday 和 Cyber Monday,只有約 10% 的 Shopify 商店使用 GCP,其餘的商店都是由他們自己的數據中心託管。然而在 2018 年,Shopify 全力投入 GCP,將 GCP 作為基礎設施的供應商,100% 的 Shopify 零售商店都在我們的平台上運行。

Shopify 是 Docker 容器的早期使用者,現在使用 Google Kubernetes Engine 作為其容器管理系統,並使用Cloud Storage 統一物件儲存服務。

在假期購物季來臨前幾個月,Shopify 產線工程師開始與 Google 的 BFCM 團隊一同工作。我們在容量規劃方面合作,使 Shopify 擁有所需的容量緩衝,以應付比 2017 年更大的流量高峰,並協助診斷並修復潛在的性能問題,像是網路延遲。

在今年剩下的時間中,我們的 Shopify 客戶團隊透過 Slack、Google Hangouts Chat 和其他即時通訊工具,與 Shopify 的工程師保持高度的互動。為了因應 Black Friday 和 Cyber Monday 的到來,我們提高了通訊的頻率,並將 Google 員工派遣到 Shopify 在多倫多的戰情室。

「當我們進入 2018 年 的 BFCM 時,我們的數據中心能力不再足以應付,」Shopify的產線工程總監 Camilo Lopez 說,「但我們有信心,透過 Google Cloud ,我們能獲得一個成功的 Black Friday 和 Cyber Monday 所需要的支援和強大的技術基礎。這場重要的購物節將不會發生任何意外。那個週末,我們的商家共售出超過 15 億 美元的商品,高於 2017 年 10 億美元

這個 BFCM 假期破了 Shopify 的有史以來記錄,每分鐘創造近 11,000 筆訂單的高峰,此外,在週末的非正常服務期間,每秒約有 100,000 個請求。整體來說,大多數系統指標都是 2017 年的 1.8 倍。

雲端計算和支援可實現無壓力事件

透過遵循上述的策略,你可以做好預備以因應任何事,無論是巨大的或是意料之外的流量高峰,亦或是每年大幅提升的銷售量。這爲您的客戶和 IT 團隊帶來許多好處。在今年的 BFCM 成功結束後之後,我們新零售夥伴的員工向我們致謝,並表示 2018 年是他多年來第一次與家人一同享受感恩節晚餐。

想在流量高峰的狀況下依然臨危不亂,請在活動前事先規劃和準備。假設性地思考一下您的服務可能會如何失敗、如何檢測這些錯誤,又要如何處理他們。執行測試來找到潛在的弱點。選擇良好的客戶體驗衡量標準,並在活動期間密切監控您的基礎設施。立即做後續檢討,讓下一個大活動能更順暢。了解更多如何在您的組織應用這些策略的信息。

當然,我們的 GCP 支援團隊會在這些活動中提供幫助,包含計畫內和計畫外的活動。如果您有我們能提供協助的大型活動,請與您的技術客戶 Peak performance 經理或您的 Google Cloud 客戶團隊聯繫。

(原文翻譯自 Google Cloud。)

 

分享本文:
FacebookLineTwitter
回到頂端