每次在超商、藥妝店、百貨公司結帳時,「發票存載具」已成為許多台灣消費者的日常,而許多人也習慣透過「發票存摺 App」進行發票儲存、自動對獎、查詢消費紀錄,這個由麻布數據科技開發的 App,已經默默累積超過 850 萬會員,是目前全台規模最大的發票資料平台之一。
這些來自載具的發票數據,其實正是理解台灣實體零售市場最即時、最真實的數據金礦,能進一步協助零售品牌制定以數據驅動的策略。然而,要從這些來自不同通路、POS 系統的異質資料中產生洞察,其實並不容易,單一商品經常出現數百種變形組合的名稱,造成大量「髒數據」。麻布數據在 iKala 的協助下,成功藉由 Google Cloud Vertex AI,將資料從清洗到產出洞察提升 9 倍效率,加速品牌掌握市場趨勢與消費行為的關鍵時機。
麻布數據打造全台最大實購資料庫,補足零售品牌線下數據斷層 
當今零售品牌在制定行銷策略時,往往需要線上與線下數據來做決策規劃,在線上數據這一塊,Meta、Google、LINE 等國際科技平台不僅技術成熟、用戶基數龐大,已經能協助品牌掌握絕大多數的線上行為資料;然而,對於涵蓋超商、藥妝、量販等實體通路的「線下零售」而言,數據能見度卻始終是長期盲區。
麻布數據科技正是補上這塊關鍵拼圖的在地業者,成立於 2008 年,最初以比價平台起家,隨著消費行為逐漸數位化,於 2018 年開始轉型,推出發票存摺與 Moneybook 記帳服務,累積超過 850 萬會員與 40 億筆發票資料,成為台灣最大規模的零售實際交易數據資料。團隊更近一步將累積的龐大消費數據去識別化後,發展出專為品牌而設的「引客數據」(Invos Data)服務,協助企業藉由真實的消費者行為,精準制定市場策略、銷售佈局。
麻布數據科技執行長陳振榮提到,麻布數據的資料庫擁有四大優勢——大(850 萬用戶、40 億消費數據)、快(雲端發票在 48 小時內即能獲得資料)、廣 (數據涵蓋線上與線下消費管道)、真(實際消費數據),而麻布數據也透過這些龐大的資料,協助品牌精準描繪消費者輪廓,加速推進數據驅動的行銷決策。
不過,線下零售數據在處理上有一大挑戰,便是「髒數據」的問題,在於不同通路 POS 機當中的商品名稱命名不一,以單一款紅茶商品舉例,在不同通路可能出現數百至上千種不同名稱,導致團隊在進行資料分析前需耗費大量時間、人力處理資料清整的作業。
導入 Vertex AI 精準清洗髒數據,資料洞察效率提升 9 倍
為了因應日益龐大的會員與資料分析需求,麻布數據早在 2011 至 2012 年間便將架構從地端機房轉移至 Google Cloud。陳振榮表示,雲端不僅可避免傳統機房半夜當機等維運風險,也具備更高的彈性與成本優勢。並且,Google Cloud 是唯一在台設有落地機房的國際雲服務,能符合主管機關對金融資料本地化的規範,因此一路沿用至今。
麻布數據技術長王趯霖指出,目前麻布數據主要採用三大 Google Cloud 服務。首先是 Vertex AI,此乃麻布數據最感驚艷、也最能解決核心業務資料分析痛點的關鍵。過去針對發票明細大量髒數據的問題,團隊仰賴專業「打標師」人力一筆一筆進行人工判別,然而當數據清理速度,追不上會員成長速度,團隊開始尋求更聰明的做法。如今導入 Vertex AI,不僅大幅提升商品名稱辨識的準確度,在多次內部測試中,Google AI 模型在處理異質商品命名時,能成功辨識出人類無法判斷的錯字或簡寫商品,準確率達 99%。
更關鍵的是,Vertex AI 也協助團隊將資料清理流程從「營運瓶頸」轉變為「策略加速器」。陳振榮提到,原本仰賴傳統市調方式可能需要 45 個工作天才能完成的消費洞察,如今搭配 Vertex AI 處理後,可在短短 5 天內產出完整分析結果,處理效率提升 9 倍,為品牌客戶提供更即時、更敏捷的零售決策支援。
除了強化資料清洗流程,麻布數據也高度依賴 Cloud SQL 作為其核心資料庫服務,因應每日持續湧入的發票與明細資料,麻布數據透過 Cloud SQL 建構一套可彈性調整、全託管的資料儲存架構,確保所有資料可 24/7 不中斷地即時寫入與處理,讓技術團隊能專注於更高價值的資料應用與 AI 模型優化。
在系統部署與維運方面,麻布數據將所有服務建置於 Google Kubernetes Engine(GKE)。王趯霖分享,團隊結合 Terraform 進行基礎架構自動化設定,並以 Argo CD 管理所有服務部署流程,確保每項變更都經過程式碼審查,有效降低人為錯誤風險。這套 Infrastructure as Code 流程不僅符合國際 DevOps 標準,也讓麻布數據在推動產品更新時更加敏捷與穩定。
iKala 與 Google Cloud 緊密連結,協助麻布數據優化雲端架構與深化 AI 落地
隨著麻布數據團隊深化 Google Cloud 服務的應用,王趯霖説,成本對於軟體公司的毛利影響至鉅,為此不僅於內部設置 Cost Alert 機制,嚴防專案成本失控,更在 iKala 悉心建議下,採用能維持服務品質,同時節省成本的優惠方案,只要產生 5~6% 撙節,便會對經營績效多所貢獻。
除了協助優化 Google Cloud 雲端架構,王趯霖也分享,iKala 與 Google 緊密的資源連結,是選擇其作為長期合作夥伴的重要原因之一,相較於一般代理商僅提供帳務與平台操作支援,iKala 深入參與技術應用層面的協作,協助麻布數據與 Google 原廠技術人員針對特殊情境進行討論,包含反向商品辨識等獨特應用,確保技術精準落地且具成效。同時,iKala 亦定期邀請麻布數據團隊參與 Google 內部技術分享與活動,讓他們能持續掌握 AI 應用脈動。
展望未來,麻布數據計畫將 AI 的應用從資料清理延伸至更具價值的創新場景,持續強化產品服務與內部營運效率。針對消費者,團隊正開發智慧比價功能,透過 AI 辨識發票商品後,自動比對各通路即時價格,並在出現更優惠選項時主動推播通知;在內部營運層面,麻布數據也正規劃導入生成式 AI 應用於軟體開發流程,未來工程師將可由 AI 協助完成初步程式碼撰寫與重複性工作,再由人力進行審查與調整,期望達成一人等於五人的產能躍升。