技術專欄

集結國內外精選文章，掌握最新雲端技術新知與應用

如何訓練機器學習系統? – Machine Learning 教學系列(三)

2021/11/09

類別： AI 與機器學習

作者： iKala Cloud

機器學習系統是如何被訓練的？(三)

在了解 AI、Machine Learning、深度學習的差異以及如何選擇正確且合適的資料後，我們來看看機器學習系統是如何被訓練的吧！

監督式學習

Machine learning program 提供了帶有標籤的訓練數據，它可以告訴系統如何對示例數據進行分類，舉例來說:

顏色	重量	標籤
紅色	200g	蘋果
橘色	300g	橘子
綠色	150g	蘋果

這裡的每一列數據，都是由我們告訴系統：在給定兩個輸入(顏色和重量)的條件下，預期的輸出標籤應該是什麼(是蘋果?還是橘子?)。接下來，機器學習系統會依據給定的資料進行預測，以決定新的輸入(顏色和重量)代表的是蘋果或是橘子。較多研究集中在這個領域。

非監督式學習

機器必須從一個未標記的數據集中學習。

想像一下，一個圖表上有一堆點分別代表三個不同的東西，機器必須替3個不同的集群完成分類。這是非常棘手的，因為事前並不知道集群的數量，所以必須做出最好的猜測。另外，有時這些叢集不像這裡顯示的那樣清楚。

強化學習

透過獎勵或懲罰的機制來反復學習。該程序透過數百萬次的遊戲來學習，當它做出一個很好的舉措時，我們獎勵它的行為，這使它強化了對此舉動的連接。當它失敗時，我們則不給予獎勵 (或是負面的獎勵) 。

隨著時間的推移，它會學習如何在沒有人明確地告訴它規則的情況下將報酬最大化。當它做出以前從來沒有人想過的動作時，它可以比人的表現更好。

它們是怎麼運行的?

ML 系統可以嘗試多種學習模式來提交數據給它來進行分類，我們將通過接下來幾個非常簡單的例子 (真正的 ML 系統經常使用兩個以上的維度) 帶您了解一些系統背後的概念與見解。

事實上，在頂尖的研究成果背後所使用的數學方法和理論會比這些簡單的例子還要複雜，(有時甚至會同時結合數個複雜的數學方法以達到更好的成果，不過這部分已經超過本文所探討的內容)，但是透過數學來找到模型的基本原則仍是相同的。

現在聯繫 iKala Cloud，瞭解更多 GCP 加值服務！

範例一

記得在高中時，你必須繪製一個X，Y圖上的點，然後繪製一條最切合的線？這就像一個非常簡單的ML系統。在這個例子中，用你繪製的那一條線，你可以預測給定的X，可能會有什麼Y值 – 即使是未知的值，這是一種 “迴歸分析” 的形式。

ML程序靠自己來計算這些線。

範例二

在這個例子中，我們可以透過使用一條線來劃分兩個集群，以此來預測未來的例子。通過線上的任何東西很有可能是紅色的類別，線以下的任何東西都是藍色的類別。正如你所看到的那樣，雖然可能會有一些異常值，但是大部分它都會預測正確。我們在這裡使用了一條直線作為分隔線，但實際上這條分隔線也有可能更複雜，它也有可能是一條拋物線。

範例三

在這個例子當中，並不是以線條的方式呈現，我們可以看到ML被用來學習如何透過抽樣X來知道點附近的分類有兩個點集群，顏色背景顯示它將如何預測在沒有現有點的地區之前從未見過的未來點。例如我們在右下角創建了一個觀察點，它會將其歸類為藍色數據，因為最接近的3個點大部分是藍色的，分類的類型被稱為最近鄰居法。

神經網絡

我們的大腦由86億左右的 “神經元” 相互聯繫組成，每個神經元對某些刺激作出反應，並將輸出傳遞給另一個神經元。例如，可能是一個專用於識別貓一群神經元 (一些用於毛皮，眼睛，鬍鬚等) ，每個都有一個不同的權重 (根據該特徵的重要性)對整體貢獻。如果所有條件都成立，你的大腦將告訴你看到一隻貓。在ML當中，人造神經網絡 (鬆散地模擬大腦) 被用來計算他們所訓練特徵的概率。

深度神經網路

深度神經網路 (DNN) 只是由輸入和輸出之間的許多 “隱藏層” 組成。每一層都可以從中學到更高層次的學習。這些隱藏層通常具有較低的維度，因此它們可以更好地概括，而不會過度地適應輸入數據。系統中的這些中間層可以學習功能的特徵。例如一連串的“邊緣”特徵可能會導致辨識出 “部分面容” ，最後系統可以識別出 “臉”。

ML的輸出類型

常見的ML輸出類型

1. 迴歸分析 – 預測數值 (e.g. 房價)
2. 分類 – n個標籤之一 (e.g. 貓、狗、人)
3. 分群 – 與其他例子最為相似 (e.g. Amazon上的相關產品)
4. 序列預測 – 接下來是什麼? “例如給定一段文字，根據上下文填空”

連續輸出

這意味著ML系統的輸出是十進位制數，例如 8.3984。
因此給了一些輸入，你將得到一些數字的輸出。舉例來說，假設一個橘子重200克，其半徑是4.2英寸，這裡將得到的輸出是4.2，這是ML系統嘗試預測出來的。線性回歸試圖擬合一條直線到數據，以便您可以給定輸入 (x) 來預測某個值 (y)

分類

所有數據的類別 (或標記) 是由一組輸入所決定，而輸出為離散的。舉例來說：
輸入：頭髮，爪子，鬍鬚
輸出：貓
輸出的會是一個標籤，而不是像迴歸分析或概率估計那樣是個數字。

概率估計

這意味著ML系統的輸出是介於0到1之間的十進位制數，表示我們認為給定輸入是某個期望輸出的機率 (0.751 == 75.1％) 。舉例來說：ML系統可以預測瓶子裡有多少個白色磚塊，如果它以54.3％的概率輸出 “9”，那麼我們就可以根據這個資訊和信心指數做一些很有用的事情。

輸出的使用

一旦你以迴歸分析、概率估計、或分類的形式輸出，那麼程式設計師就可以做一些有用的事以獲取資訊。假設我們80％確定我們看到的是一隻貓，也許我們會想要餵牠。但如果我們只有75％的把握，也許我們會等待直到我們更確定。

延伸閱讀

1. 人工智慧、機器學習、深度學習是什麼? – Machine Learning 教學系列 (一)
2. 該怎麼選擇資料，來訓練機器學習系統? – Machine Learning 教學系列(二)

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

全方位 IT 服務

GoogleCloud

AWS

GoogleWorkspace

AIOps

跨雲整合

效能監測

API 管理

開源安全

技術專欄

如何訓練機器學習系統? – Machine Learning 教學系列(三)

機器學習系統是如何被訓練的？(三)

監督式學習

非監督式學習

強化學習

它們是怎麼運行的?

現在聯繫 iKala Cloud，瞭解更多 GCP 加值服務！

範例一

範例二

範例三

神經網絡

深度神經網路

ML的輸出類型

常見的ML輸出類型

連續輸出

分類

概率估計

輸出的使用

延伸閱讀

分享本文：

文章分類

分類

近期文章

Google Workspace AI 工具 Gemini 新定價，新增繁體中文版

Google Cloud Storage 開放存取同時實施 DDoS 防禦的兩大方案

製造業生成式AI 有哪些應用？從國際案例觀察應用場景、效益與挑戰

因果AI（ Causal AI ）解決生成式AI 的推理挑戰，看 4 大產業案例

什麼是人工智慧(AI)？人工智慧的產業應用趨勢有哪些？

標籤雲

標籤

iKala Cloud