技術部落格

集結國內外精選文章,掌握最新雲端技術新知與應用

iKala Cloud / AI 與機器學習 / Google 推出基於 Gemini 的 Gemma 模型,現已支持 Vertex AI 和 GKE

Google 推出基於 Gemini 的 Gemma 模型,現已支持 Vertex AI 和 GKE

Google 宣布推出 Gemma,這是一套輕量級且處於技術前沿的開放模型,它們基於創建 Gemini 模型的相同研究與技術。Google 非常高興地告訴大家,Google Cloud 的用戶現在可以開始在 Vertex AI 上定制和構建 Gemma 模型,並在 Google Kubernetes Engine(GKE)上運行這些模型。Gemma 的推出以及 Google Cloud 平台能力的更新標誌著 Google 致力於讓 AI 技術在 Google Cloud 上對開發者更加開放和易於接入的新階段。

 

Google Cloud 現已支持 Gemma 模型

Gemma 模型與 Google 的 Gemini 模型共享技術和基礎架構組件,這使得 Gemma 模型在效能上能夠達到同類開放模型中的最佳水平。 Google 推出了兩種規模的模型權重:Gemma 2B 和 Gemma 7B,每種規模都提供了預訓練版本和經過指令優化的版本,既適合研究也適合開發。Gemma支持 Google Cloud 開發者當前喜愛使用的工具,包括 Colab 和 Kaggle 筆記本,以及 JAX、PyTorch、Keras 3.0 和 Hugging Face Transformers 等框架。

 

Gemma 模型既可以在個人電腦、工作站上運行,也可以在 Google Cloud 上運行。通過這些新推出的開放模型,開發者現在可以在 Vertex AI 上進行定制和建構,並在 GKE 上進行部署。為了確保行業領先的性能,Gooogle 與 NVIDIA 合作,將 Gemma 優化以適配 NVIDIA 的 GPU。

 

在 Vertex AI 上發掘 Gemma 的潛力

Gemma 加入了 Vertex AI 模型中的 130 多個模型行列,其中包括 Google 最近宣布擴大訪問權限的 Gemini 模型:Gemini 1.0 Pro、1.0 Ultra 和1.5 Pro。利用 Vertex AI 上的 Gemma 模型,開發者可以享受到一個全方位的機器學習平臺帶來的便利,該平臺簡化了模型的調優、管理和監控過程。通過 Vertex AI,開發者可以減少運維負擔,集中精力打造針對特定用例優化的 Gemma 訂製版本。

 

例如,開發者可以使用 Vertex AI 上的 Gemma 模型來:

  • 開發輕量級任務的生成式 AI 應用,如文本生成、概述和問答。
  • 利用輕量級但訂製的模型進行研究和開發,探索和實驗。
  • 支持低延遲的實時生成式 AI 場景,如文本處理。

Vertex AI 使得開發者能夠輕鬆地將自己調整過的模型轉化為能夠支持各種規模AI應用的可擴展端點。

立即聯繫 iKala Cloud,了解最新 Gemma 應用!

 

透過 GKE 將 Gemma 從原型製作擴展到生產

GKE 為從簡單項目原型化到企業規模部署的自訂應用提供工具。如今,開發者還可以直接在 GKE 上部署 Gemma,自主創建生成式 AI 應用,無論是構建原型還是測試模型性能:

  • 將自訂、精調的模型以便攜容器形式部署,與使用熟悉工具鏈的應用並行運行。
  • 自訂模型服務和基礎設定,無需手動預配或維護節點。
  • 快速整合AI基礎架構,以滿足最為嚴苛的訓練和推理需求。

GKE 提供高效的資源管理、一致的操作環境以及自動擴展功能。此外,它還簡化了 Google Cloud AI 加速器(包括GPU和TPU)的編排工作,幫助加速生成式 AI 模型的訓練和推理過程。

 

立即開始在 Google Cloud 上使用 Gemma

您現在就可以開始在 Google Cloud 上使用 Gemma 模型,具體可以通過 Vertex AI GKE 進行操作。

要了解更多關於Gemma的信息,可訪問 ai.google.dev/gemma 查看快速入門指南。

 

延伸閱讀

  1. 企業級 Gemini (Gemini Enterprise) 隆重登場,現可透過 Google Workspace 使用 Gemini,賦能各種規模團隊

  2. Google 推出最新 AI 「Gemini」服務,5 分鐘帶你了解 Gemini Ultra、Pro 與 Nano 三大模型差異

分享本文:
FacebookLineTwitter
回到頂端