2020年4月6日 星期一

關於 Google 的雲端機器學習方案 Cloud TPU

今天看到一篇 Google GCP 工程師寫的文章 :

Google AI 和機器學習在 IaaS、PaaS、SaaS 層面的體現

此文主要簡介谷歌雲端計算平台 GCP 的 Cloud TPU+TensorFlow 機器學習解決方案, 從中可以粗略了解谷歌以 TPU (張量處理器) 為硬體運算核心, 以 TensorFlow 機器學習框架為軟體工具的基本架構, 在目前以上雲來解決設施估算難題與因應業務彈性需求的潮流中有其優越之處, 摘要整理如下 :
  1. TPU 運算性能比 GPU/CPU 高出 15~30 倍, 每瓦特效能高出 30~80 倍.
  2. TPU 的核心為 MXU 矩陣乘法單元, 通過限制暫存器的操作靈性換取更高的操作密度.
  3. TPU 採用 8 位元低精度運算以降低每步操作所使用之電晶體數目, 對機器學習運算準確度影響很小, 但卻可大幅降低功耗. 
  4. Cloud TPU 在圖像模型訓練上可達每秒四千張, 而 Nvidia 的 GPC 只能達到每秒 600 多張. 
  5. Cloud TPU 是專為 TensorFlow 進行優化的硬體加速器, 每顆 TPU 由四個 ASIC (特殊應用積體電路) 晶片組成, 浮點運算效能最高可達 180 TFLOP (萬億次, 10^12).
  6. Google 照片與 Google 翻譯都使用了 TPU 來加速背後的神經網路計算. 
  7. GCP 上的自然語言處理 API 目前可透過 STT (音轉文) 與 TTS (文轉音) 識別超過 120 種語言. 
  8. GCP AI Hub 一鍵式平台可以協助用戶管理與維護複雜的機器學習環境.
使用 GCP 上的 Cloud TPU + TesorFlow 似乎是雲端機器學習的優選方案, 根據 Google Cloud TPU 的介紹, 其第三版效能更高達 420 TFLOP! 參考 :

運用 Google Cloud AI 提升企業實力

費用方面 Cloud TPU 價格以小時計費 (因地區而異), 單一 TPU 價格如下 :





AWS 的機器學習運算 SageMaker 訂價則是按所選用的 AWS 執行個體來計費 (也是以小時算), 參考 :

Amazon SageMaker 定價
AWS 上的機器學習

相較之下 GCP Cloud TPU 計費就簡單明確多了, 因為它就綁死硬體啊!

沒有留言 :