如今企業要招募資料科學家做分析、建造 AI 模型已不再是難事,真正的問題點在於資料的蒐集清整、模型部署與存取權限等;尤其像銀行這樣的大型機構,不同業務部門之間的資料不便互通,不同組織層級的員工能存取資料集的權限亦有不同。這些瓶頸,常在無形間成為驅動 AI 的絆腳石。
看準 AI 市場的前瞻性,InfuseAI 自 2018 年成立以來,即致力於讓企業打造屬於自己的 AI 應用,協助解決他們在導入 AI 時可能碰上的種種疑難雜症。旗下服務 PrimeHub 機器學習加速平台,提供企業單位一站式的 AI 開發環境,包括底層基礎設施、機器學習框架、資料權限控管、運算資源花費管理等,透過 PrimeHub 平台點選就能輕易使用監控,藉以降低企業單位導入 AI 的門檻,加速導入效率。
創立第一天就上雲!GKE 開關機器、版本更新自動又快速
特別的是,InfuseAI 自創立以來,公司就維持全遠端、無實體的辦公環境,團隊透過 Google 工具協作,服務也在一開始就選擇部署在 Google Cloud 上。InfuseAI 共同創辦人兼營運長薛良斌表示,起初產品就用 Kubernetes 開發,而放眼各雲端服務商的 Kubernetes 託管服務,Google Cloud 自然是最成熟的。不僅如此,Google Kubernetes Engine(以下簡稱 GKE)根據工作負載自動擴展、版本更新與升級的速度也相當快,讓開發團隊不必煩惱 Kubernetes 的版本問題。且相較於地端機器,透過雲端運算效能明顯提升,開發團隊若想做任何測試,開 GKE 叢集也非常快速方便,亦不必介入底層機器的管理。
在導入 PrimeHub 平台前,企業單位通常會索取線上試用版。因應此需求,團隊也利用 GKE 叢集來隔離不同的試用環境給客戶,協助設置環境後,自動開啟機器即可使用,加快工作流程。
Cloud Logging 串接第三方工具,輕鬆了解客戶試用狀況
另外,團隊也會使用 Cloud Logging 監控企業單位使用線上試用版的狀況。這項全代管服務,可擷取 GKE 環境、虛擬機器 (VM) 或 Google Cloud 中的應用程式與系統記錄檔資料 (log) 和自訂記錄檔資料。InfuseAI 團隊再將 Cloud Logging 上的 metrics 串接到第三方工具方便人員即時檢視。
Google Cloud 多樣代管工具,處理資料流程更便捷
薛良斌也提到,Google Cloud 多種「開箱即用」的產品讓工程師省去自行搭建工具的麻煩。比如,內部在做整合測試、處理資料時,就會使用如 Cloud Dataproc 這樣的代管工具,管理 Hadoop 或 Spark 叢集。Cloud Dataproc 能在幾分鐘內快速啟動叢集並自動調度叢集資源,就不用靠自己架設 Hadoop 或 Spark 叢集,使用上更便捷。
而在做產品功能的 POC (proof of concept) 需處理資料、執行分析時,使用 BigQuery 就能透過下 SQL 快速看到報表,內部也會將帳務等各種資料匯入至 BigQuery 分析,作為企業資料倉儲來說,非常實用。
被問到 PrimeHub 服務與 Google Cloud AI 平台相關產品的差異,薛良斌則認為,Google Cloud 上提供的產品就好像積木,資料工程師或資料科學家能更自由、彈性地組合出想要的工具或應用,而 PrimeHub 平台則是直接根據企業常見的商業情境,將這些積木組起來後提供企業使用,認為彼此之間具有一定的互補性。
「Google Kubernetes Engine(以下簡稱 GKE)根據工作負載自動擴展、版本更新與升級的速度也相當快,讓開發團隊不必煩惱 Kubernetes 的版本問題。且相較於地端機器,透過雲端運算效能明顯提升,開發團隊若想做任何測試,開 GKE 叢集也非常快速方便,亦不必介入底層機器的管理。」── InfuseAI 共同創辦人兼營運長薛良斌
對於未來業務規劃,InfuseAI 更期待將 PrimeHub 服務拓展至海外,而團隊也發現海外使用者對於機房位在雲端的接受度普遍高出台灣許多,因此,加深其產品與雲端的整合也會是任務之一。此外,他也認為在執行 AI 分析時,不同位置的資料如何整合會是一大挑戰,因此像是 Anthos 這樣的混合雲解決方案,也會是企業未來考量的重點方向,而 Google Cloud 長期合作的策略夥伴 iKala Cloud 也將於其中扮演重要的輔助與技術導入角色。