技術部落格

集結國內外精選文章,掌握最新雲端技術新知與應用

iKala Cloud / 產業解決方案 / Hearst Newspapers:透過雲端機器學習與讀者深度互動

Hearst Newspapers:透過雲端機器學習與讀者深度互動

對新聞出版商而言,讓讀者能夠在數位內容上快速且精準取得感興趣的文章和廣告非常重要。以全球最大的大眾媒体出版商之一 ── Hearst 媒體集團旗下的新聞部門 Hearst Newspapers 來說,要將內容妥善分類,曾是非常艱鉅的過程。他們平均每天要分類 3,000 篇新文章,標記和分類都非常耗時,而且編輯團隊為了趕上進度,常常不得不將某些內容優先排序處理,而某些文章不予分類。

Hearst Newspapers 並未聘用更多的人力,而是透過 Google Cloud AI 有效解決了這個問題。 使用 Google Cloud Natural Language API,在簡易 REST API 上以強大的機器學習模型將內容加以分類後,不論文章內容架構如何在 Hearst 各式網站上多元呈現,Hearst Newspapers 都能知道其內容為何。雖然,過去 Hearst Newspapers 也嘗試在舊系統中自動化分類過程,但在速度或準確性上,都不如 Google Cloud AI。

Hearst Newspapers 的資深數據總監 Naveed Ahmad 表示:「Google Cloud Natural Language API 在內容分類的準確度上表現得出類拔萃。」他負責在 GCP 上實踐數據集中化和商業智慧應用。他指出:「我們每天在 30 多個媒體渠道上發表數千篇文章,透過自然語言處理,就可以快速了解什麼樣的內容被最新發佈,以及這些內容如何與受眾產生共鳴。」

創新的個人化

Hearst Newspapers 希望能透過 Google Cloud 機器學習技術,找出創新方式來擬定個人化內容和讀者互動。Google Cloud 提供的 Natural Language API 結合 DFP 廣告管理系統,協助 Hearst Newspaper 編輯團隊節省過去花在手動標記內容的時間;更進一步,它也優化了廣告的目標受眾來增加收入。這樣一來,Hearst Newspapers 就可以根據內容來分析過去的廣告收益成效,並根據內容類別去預測未來的廣告表現。

藉由將文件內容分類到預先定義好的 700 多個類別(如:新聞、科技、健康、娛樂…等),Hearst Newspapers 可以即時自動解析文章含義,並更有效率地組織/呈現文章。此外,Hearst Newspapers 也使用 Natural Language API 中的專有名詞辨識功能 (entity recognition),快速識別內容中所包含的人物、地點、事件。

Naveed 表示:「從 Google Cloud Natural Language API 獲得更細緻的數據後,我們可以鎖定更具體的內容,把廣告與更精細的讀者輪廓關聯在一起。這節省了我們很多時間,再也不必每天手動分類 3,000 篇文章。」

這項功能不僅可以為廣告團隊每天節省好幾個小時的工作時間,更為廣告提供更多的內容配對選擇。過往,廣告團隊只能透過手動分類,為一小部分內容取得更好的廣告定向;現在,所有新的內容都可以透過自動化方式來達成這項目標。

Google Cloud Natural Language API 的分類和實體數據也會傳送到 Hearst Newspapers 的客戶數據平台 (Customer Data Platform),而客戶數據平台用來新增用戶的個人資料,以及根據閱讀習慣新增新的分類。這也代表 Hearst Newspapers 可以將特定訊息和內容提供給相對應的分類。

Hearst Newspapers 也將所有 CMS 的內容和 Natural Language API 生成的標籤,匯入到 BigQuery 中,將這些資料與 Google Analytics 的數據整合,就可以針對所發佈內容的性質與生命週期進行複雜的分析。這讓 Hearst Newspapers 可以更了解與讀者的互動模式,同時也有助於推動之後的內容策略優化與投資規劃。

Google Cloud 導入成效

  • 將多達 30 種以上不同媒體屬性的線上內容進行即時分類,讓創作者能夠根據類別和單元來查看模型與洞見。
  • 提高內容分類的速度和準確性,同時降低人力成本。
  • 預測內容成效,藉此增加廣告收入。
  • 將數據整合進顧客數據平台 (Customer Data Platform),以「閱讀習慣」將讀者分群。

內容出版商的新世界

Hearst Newspapers 同時也在嘗試其他 Google Cloud AI 的機器學習產品,從 API 模型到架構在 TensorFlow 的內容推薦引擎。(TensorFlow 是由 Google 所推出的機器學習開源軟體庫。)

Hearst Newspapers 也有使用 BigQuery 來分析內容表現和計算各廣告版位的價值。BigQuery 資料移轉服務 (Data Transfer Service) 讓企業可以集中管理來自 Google Analytics 和企業內部的數據,進而幫助企業可以根據網路流量趨勢來分析其廣告活動。

Naveed 表示:「Google Cloud 和雲端機器學習服務為 Hearst 開拓了新的世界,讓所有出版商都可以從數據中獲得更多價值,我們很期待未來能創造更多的可能性。」

了解更多 AI 自動貼標與媒體/社群應用案例

關於 Hearst Newspapers

Hearst 國際集團是全美最多元的媒體、資訊和內容服務公司之一,擁有 360 多家相關企業。Hearst Newspapers 則是主要負責報紙、在地數位行銷和工商廣告目錄服務的營運團隊。擁有超過 4,000 多名員工,Hearst Newspapers 透過相關數位化產品,累計超過 4,200 萬名不重複訪客。

 

(原文改寫自 Google Cloud。)

分享本文:
FacebookLineTwitter
回到頂端