Google, Microsoft 和 Amazon 機器學習圖片/影片辨識 API 的比較 (四)
在上一篇帶您了解 Google, Amazon, Microsoft 在文字分析和翻譯 API 上的差異後,這一篇將帶您了解在圖片和影片辨識的領域中,這三間大廠 API 的特性與優劣。
圖像與影像處理 APIs: Amazon Rekognition
Rekognition API 用於圖像以及最近的影像識別任務。 這其中包括了:
• 物件偵測和分類(查找和偵測圖像中的不同物件並定義它們是什麼)
• 可以增測出影像中像是“跳舞”或是“撲滅火”等複雜動作
• 臉部識別(用於偵測人臉並找到匹配的面孔)和情緒分析(這個分析相當有趣,因為它可以偵測到笑臉,分析眼睛,甚至在影像中定義情感情緒)
• 檢測不適當的影像
• 辨識出圖片和影像中的名人(無論目標是什麼)
圖像與影像處理 APIs:Microsoft Azure 認知服務
來自 Microsoft 的 Vision 套件結合了六個 APIs,主要在於分析不同類型的圖像,影像和文本。
• 電腦視覺,識別物件、動作(如行走),並在圖像中定義主色
• 內容過濾,在圖片、文字和視頻中偵測不適當的內容
• 臉部 API 偵測臉部,將其分組,並定義年齡,情緒,性別,姿勢,笑容和鬍子
• 情緒 API 是另一種用來描述臉部表情的識別工具
• Custom Vision Service 支持您使用自己的數據構建來定義圖像識別模型
• 影像索引器是一種在影像中查找人物的工具,定義語音情感並標記關鍵字
圖像與影像處理 APIs:Google Cloud Services
Cloud vision API – 該工具是為了圖像的識別而建立的,對於找尋特定的圖像屬性非常有用:
• 標記物件
• 偵測人臉並分析表情
• 尋找地標和描述現場(例如假期,婚禮等)
• 在圖像中找尋文字並識別語言
• 主色調
Cloud Video Intelligence – Google 的影像識別 API 在開發初期就比 Amazon Rekognition 和 Microsoft Cognitive Services 提供的功能較為缺乏。 目前的 API 提供了以下工具集:
• 標記並定義動作
• 識別明確的內容
• 錄製語音
在功能列表級別上,Google AI 服務可能缺乏一些功能,但 Google API 所具有的強大功能就在於 Google 可以將取得的大量數據集中。
現在聯繫 GCP專門家,瞭解更多 GCP 加值服務!
特定的 API 和工具
我們將在這裡討論來自 Microsoft 和 Google 的特定 API 產品和工具,並沒有包括 Amazon 是因為它們的 APIs 僅僅與文字分析和圖像 + 影像分析的上述類別相匹配。 但是,這些特定的 APIs 的一些功能也存在於 Amazon 的產品中。
Azure Service Bot framework – 微軟已經致力於為用戶提供靈活的機器人開發工具集。 基本上,該服務包含用於使用不同編程語言構建,測試和部署機器人的完整環境。
值得一提的是 Bot Service 並不一定需要使用機器學習的方式,由於微軟提供了五個模板(基本,形式,語言理解,主動和問答),其中只有語言理解類型需要高級的 AI 技術。
目前來說,您可以在 Azure 上使用 .NET 和 Node.js 的技術構建機器人,並將其部署到以下平台和服務上:
• Bing
• Cortana
• SkypeWeb Chat
• Office 365 email
• GroupMe
• Facebook Messenger
• Slack
• Kik
• Telegram
• Twilio
Bing Search from Microsoft 微軟提出了七個與核心 Bing 搜索功能連接的 API,包括自動建議,新聞,圖片和影片搜索。
Knowledge from Microsoft 這個 APIs 將文本分析與廣泛的獨特任務相結合:
• Recommendations API 允許構建購買個性化的推薦系統
• Knowledge Exploration Service 允許您輸入自然查詢以從數據庫檢索數據,視覺化數據和自動完成查詢
• Entity Linking Intelligence API 被設計為突顯適當實體的名稱和詞組(例如年代搜索),並確保消除歧義
• Academic Knowledge API 會自動完成詞彙,在文字與構思上找到文件中的相似性,並搜索圖形模式
• QnA Maker API 可用於將問題的變化與答案進行匹配,以構建服務客戶的聊天機器人和應用程序
• Custom Decision Service 是一種強化學習工具,可根據用戶的喜好對不同類型的內容(例如連結、廣告等)進行個性化和排名
Google Cloud Job Discovery API 仍然屬於早期發展的階段,但很快就可能重新定義我們今天的求職能力搜尋。 與依賴精確關鍵字匹配的傳統求職引擎不同的是 Google 採用機器學習的方式來找出高度變異性的職位描述之間的相關聯繫,以避免模棱兩可。例如,它努力減少不相關或太廣泛的回報,例如查詢“銷售助理”將關鍵字 “assistant” 回傳。API 的主要特點是什麼?
• 修正在工作搜索查詢中的拼寫錯誤
• 配對所需的資歷水準
• 查找可能具有不同表現形式和行業術語的相關工作(例如,將“server”查詢回傳為“咖啡師”而不是“網絡專家”;或者將”biz dev”的查詢回傳”業務人員”)
• 處理縮略詞(例如,為“HR”查詢回傳為“人力資源助理”)
• 配對不同的崗位的描述
延伸閱讀:
機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (一)
機器學習該選誰?Google vs Amazon vs Microsoft AI 比較大全 (二)
機器學習文字分析/翻譯 API – Google vs Amazon vs Microsoft AI 比較大全 (三)
IBM Watson 及其他 AI 解決方案 – Google vs Amazon vs Microsoft AI 比較大全 (五)
(原文來自合作部落格 altexsoft,GCP 專門家授權翻譯轉載。)