技術專欄

集結國內外精選文章，掌握最新雲端技術新知與應用

機器學習圖片影片辨識 API – Google vs Amazon vs Microsoft AI 比較大全 (四)

2021/11/09

類別： AI 與機器學習

作者： iKala Cloud

Google, Microsoft 和 Amazon 機器學習圖片/影片辨識 API 的比較 (四)

在上一篇帶您了解 Google, Amazon, Microsoft 在文字分析和翻譯 API 上的差異後，這一篇將帶您了解在圖片和影片辨識的領域中，這三間大廠 API 的特性與優劣。

圖像與影像處理 APIs: Amazon Rekognition

Rekognition API 用於圖像以及最近的影像識別任務。這其中包括了：
• 物件偵測和分類（查找和偵測圖像中的不同物件並定義它們是什麼）
• 可以增測出影像中像是“跳舞”或是“撲滅火”等複雜動作
• 臉部識別（用於偵測人臉並找到匹配的面孔）和情緒分析（這個分析相當有趣，因為它可以偵測到笑臉，分析眼睛，甚至在影像中定義情感情緒）
• 檢測不適當的影像
• 辨識出圖片和影像中的名人（無論目標是什麼）

圖像與影像處理 APIs：Microsoft Azure 認知服務

來自 Microsoft 的 Vision 套件結合了六個 APIs，主要在於分析不同類型的圖像，影像和文本。
• 電腦視覺，識別物件、動作（如行走），並在圖像中定義主色
• 內容過濾，在圖片、文字和視頻中偵測不適當的內容
• 臉部 API 偵測臉部，將其分組，並定義年齡，情緒，性別，姿勢，笑容和鬍子
• 情緒 API 是另一種用來描述臉部表情的識別工具
• Custom Vision Service 支持您使用自己的數據構建來定義圖像識別模型
• 影像索引器是一種在影像中查找人物的工具，定義語音情感並標記關鍵字

圖像與影像處理 APIs：Google Cloud Services

Cloud vision API – 該工具是為了圖像的識別而建立的，對於找尋特定的圖像屬性非常有用：
• 標記物件
• 偵測人臉並分析表情
• 尋找地標和描述現場（例如假期，婚禮等）
• 在圖像中找尋文字並識別語言
• 主色調

Cloud Video Intelligence – Google 的影像識別 API 在開發初期就比 Amazon Rekognition 和 Microsoft Cognitive Services 提供的功能較為缺乏。目前的 API 提供了以下工具集：
• 標記並定義動作
• 識別明確的內容
• 錄製語音

在功能列表級別上，Google AI 服務可能缺乏一些功能，但 Google API 所具有的強大功能就在於 Google 可以將取得的大量數據集中。

現在聯繫 GCP專門家，瞭解更多 GCP 加值服務！

特定的 API 和工具

我們將在這裡討論來自 Microsoft 和 Google 的特定 API 產品和工具，並沒有包括 Amazon 是因為它們的 APIs 僅僅與文字分析和圖像 + 影像分析的上述類別相匹配。但是，這些特定的 APIs 的一些功能也存在於 Amazon 的產品中。
Azure Service Bot framework – 微軟已經致力於為用戶提供靈活的機器人開發工具集。基本上，該服務包含用於使用不同編程語言構建，測試和部署機器人的完整環境。
值得一提的是 Bot Service 並不一定需要使用機器學習的方式，由於微軟提供了五個模板（基本，形式，語言理解，主動和問答），其中只有語言理解類型需要高級的 AI 技術。
目前來說，您可以在 Azure 上使用 .NET 和 Node.js 的技術構建機器人，並將其部署到以下平台和服務上：
• Bing
• Cortana
• SkypeWeb Chat
• Office 365 email
• GroupMe
• Facebook Messenger
• Slack
• Kik
• Telegram
• Twilio

Bing Search from Microsoft 微軟提出了七個與核心 Bing 搜索功能連接的 API，包括自動建議，新聞，圖片和影片搜索。
Knowledge from Microsoft 這個 APIs 將文本分析與廣泛的獨特任務相結合：
• Recommendations API 允許構建購買個性化的推薦系統
• Knowledge Exploration Service 允許您輸入自然查詢以從數據庫檢索數據，視覺化數據和自動完成查詢
• Entity Linking Intelligence API 被設計為突顯適當實體的名稱和詞組（例如年代搜索），並確保消除歧義
• Academic Knowledge API 會自動完成詞彙，在文字與構思上找到文件中的相似性，並搜索圖形模式
• QnA Maker API 可用於將問題的變化與答案進行匹配，以構建服務客戶的聊天機器人和應用程序
• Custom Decision Service 是一種強化學習工具，可根據用戶的喜好對不同類型的內容（例如連結、廣告等）進行個性化和排名

Google Cloud Job Discovery API 仍然屬於早期發展的階段，但很快就可能重新定義我們今天的求職能力搜尋。與依賴精確關鍵字匹配的傳統求職引擎不同的是 Google 採用機器學習的方式來找出高度變異性的職位描述之間的相關聯繫，以避免模棱兩可。例如，它努力減少不相關或太廣泛的回報，例如查詢“銷售助理”將關鍵字 “assistant” 回傳。API 的主要特點是什麼？
• 修正在工作搜索查詢中的拼寫錯誤
• 配對所需的資歷水準
• 查找可能具有不同表現形式和行業術語的相關工作（例如，將“server”查詢回傳為“咖啡師”而不是“網絡專家”;或者將”biz dev”的查詢回傳”業務人員”）
• 處理縮略詞（例如，為“HR”查詢回傳為“人力資源助理”）
• 配對不同的崗位的描述

延伸閱讀：

機器學習該選誰？Google vs Amazon vs Microsoft AI 比較大全 (一)
機器學習該選誰？Google vs Amazon vs Microsoft AI 比較大全 (二)
機器學習文字分析/翻譯 API – Google vs Amazon vs Microsoft AI 比較大全 (三)
IBM Watson 及其他 AI 解決方案 – Google vs Amazon vs Microsoft AI 比較大全 (五)

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

技術專欄

機器學習圖片影片辨識 API – Google vs Amazon vs Microsoft AI 比較大全 (四)

Google, Microsoft 和 Amazon 機器學習圖片/影片辨識 API 的比較 (四)

圖像與影像處理 APIs: Amazon Rekognition

圖像與影像處理 APIs：Microsoft Azure 認知服務

圖像與影像處理 APIs：Google Cloud Services

現在聯繫 GCP專門家，瞭解更多 GCP 加值服務！

特定的 API 和工具

延伸閱讀：

分享本文：

文章分類

分類

近期文章

Google Workspace AI 工具 Gemini 新定價，新增繁體中文版

Google Cloud Storage 開放存取同時實施 DDoS 防禦的兩大方案

製造業生成式AI 有哪些應用？從國際案例觀察應用場景、效益與挑戰

因果AI（ Causal AI ）解決生成式AI 的推理挑戰，看 4 大產業案例

什麼是人工智慧(AI)？人工智慧的產業應用趨勢有哪些？

標籤雲

標籤

iKala Cloud