預測性維護 (Predictive maintenance) 有助於企業延長設備年限能否延長,藉由讓生產系統更加可靠,來減少設備的停機時間。在本系列文的前 2 篇文章中(第一部分和第二部分在此,歡迎讀者閱讀),我們確定了企業可能會想部署預測系統的原因,並說明了一般匯入預測系統的感應器和資料類型。在本系列文的第三篇也是最後一篇的文章中,我們將會解釋我們如何從 Google Cloud Platform (GCP) 各項產品中,建立一個完整的預測性維護參考解決方案,包括Cloud IoT Core、Cloud IoT Edge、 BigQuery 和 Cloud Dataflow 等資料處理工具,以及 Cloud ML Engine 等等的機器學習平台。
預測性維護:技術架構參考
為了示範如何在 GCP 上設計並建立一套包括各種架構組件和機器學習 (ML) 模型組件的預測性維護解決方案,我們將會以一家擁有石油鑽井平台並負責維護的公司為例。它預計利用設備供應商蒐集回來的產品使用資料、健康狀況資料,以「預測性維護」模型取代原本「碰到問題再維修」的做法。
該公司決定使用以雲端運算為基礎的預測性維護解決方案,來分析來自石油鑽井平台中感應器的即時資料,再加上預先訓練好的機器學習模型,來預測每台機器的剩餘壽命以及該機器何時會出現故障。有了這樣的模型,公司甚至可以避免計劃外的停機狀況。
圖中這個架構中的各個元素如下:
- Cloud IoT Core 幫助您安全地連接、管理和提取在世界各地的石油鑽機的資料。
- Cloud Pub/Sub 提取串流媒體事件的資料,並且把資料傳送到 Cloud Dataflow。
- Cloud Dataflow(一項託管服務)將資料轉換並儲存在 BigQuery 中。
- BigQuery 提供了一個無伺服器的資料倉儲環境來儲存和分析資料,並且提供大資料解決方案的架構,您可以在 BigQuery中 對批次處理 (batch) 的資料和串流 (streaming) 資料進行分析。
- App Engine 託管系統的可視化引擎。
- Cloud ML Engine 許您同時訓練機器學習模型和利用模型投入服務。
- Cloud IoT Edge 將 Google Cloud 的強大的資料處理和機器學習擴展到邊緣設備,如機械臂、風力渦輪機和石油鑽孔平台,這樣邊緣設備它們就可以對來自感測器的資料即時採取行動,並且可以在本地端進行預測。
用 ML 訓練預測性維護模型
有了以上這些要素之後,我們來看看如何在 GCP 上建立屬於你的預測性維護模型。
在我們的架構中,ML 模型可以預測石油鑽井平台上一台特定機器(可能是一台油泵)的剩餘壽命。模型首先對儲存在 BigQuery 中的感測器歷史資料進行訓練,之後當新的即時資料不斷匯入系統時, 該模型就可以預測機器的剩餘壽命。
下圖展示了這部影片 Demo 的技術架構和 ML 模型。對於即時資料匯入(線上預測),在進行預測之前需要進行轉換,而前處理 (preprocessing) 部分,應該在訓練階段和預測階段之間都開放共享,以確保模型的準確性。
此架構中,一個重要組成部分是 Cloud Dataflow,它可以對歷史資料(用於訓練)和串流資料(用於預測)都應用同一套轉換器。由於 Cloud Dataflow 的資料會流往 BigQuery,因此我們可以在應用程式和報告中獲得最新的資料,以便進行敏捷的決策。
網路邊緣 (edge) 的機器學習:應用情境
雖然將資料放在雲端上,意味著您可以利用更複雜的處理方式以及更豐富的機器學習模型,但是在很多情境下,對資料的預測只有在資料生成後的幾秒鐘內有用。例如,想想信用卡詐騙、自動駕駛汽車和工業機器,這些場景都幾乎需要即時預測。另外,在某些情境中,邊緣設備上的預測能帶給用戶優質的體驗,例如即時翻譯、語音、以及物聯網場景等等。還有一些特殊情況下,網路連接並不穩定,比如在飛機和船上,這樣的情況下,在邊緣設備進行預測,會比通過網路發送資料來得更划算。
邊緣運算,代表將資料處理能力放在網路邊緣,而不是將處理能力集中在雲端或資料倉儲中。這是一個很強大的概念,尤其是在物聯網方面;透過邊緣運算,您可以在更接近資料蒐集的地方處理物聯網資料,而不是將其以遠距離方式發送去雲端。
以我們的石油鑽井平台為例,Cloud IoT Edge 將 Google Cloud 強大的資料處理和機器學習能力擴展到數十億台邊緣設備,例如:機械臂、風力渦輪機和石油鑽井平台,這樣它們就可以對感測器的資料即時採取行動,並且在本地端預測結果。
尤其是邊緣運算,更為製造業帶來了五大潛在優勢:
1. 更快的回應時間﹕
因為無需往返雲端,所以減少了延遲,此外,更快的回應能力,將有助於阻止關鍵機器操作故障或者危險事故的發生。
2. 連線穩定、運作可靠﹕
對於遠程設備,例如油井、農場水泵、太陽能農場或風車等,如果互聯網連接不穩定會很困難進行監測。而邊緣設備能夠在本地端儲存和處理資料,確保在互聯網連接受限的情況下,不會發生資料丟失或者操作失敗。
3. 安全性和合規性﹕
由於邊緣運算的架構性質,您可以去除設備和雲端之間大量多餘的資料傳輸,並且,邊緣設備可以在本地端過濾掉敏感訊息,只將重要的資料模型建立訊息傳輸到雲端,這使得用戶可以建立一個足夠安全並合符規定的框架,這一點對於維護企業安全和進行年度審核來說是必不可少的。
4. 具有成本效益的解決方案﹕
圍繞物聯網的實際問題之一是網路頻寬、資料儲存和計算能力的前期成本。通過邊緣運算,您可以在本地端進行大量的資料轉換,這使得企業可以決定在雲端部署或擴展哪些服務。
5. Edge TPU﹕
除了 Cloud IoT 之外,GCP 還提供了邊緣環境的物聯網專用芯片 Edge TPU,再加上 Cloud IoT Edge,這是一套軟體,能夠將 Google Cloud 的 AI 能力擴展到網關和連接設備。 您可以利用 Edge TPU 和 Cloud IoT Edge 在雲端構建和訓練機器學習模型,然後在使用 Edge TPU 硬件加速器的同時,在 Cloud IoT Edge 設備上運行它們。
現今的工廠設施、航空引擎和石油鑽井平台正進化為複雜的工業物聯網系統,其中有成千上萬的組件,每個組件都必須正確運行以獲得最佳效能。對於這些系統進行預測性維護,可以大大節約成本,提高其可靠性。
透過利用物聯網、大數據、機器學習和邊緣運算等新興技術,您可以對生產過程有了更多至關重要的了解,並開始將機械世界轉變整合為一個既智能又互相連接的世界。想要了解更多訊息,請關注 Google Cloud 的Cloud IoT 網頁。
(本文翻譯改編自 Google Cloud。)
延伸閱讀: