講起深度學習,大家可能都會想到 Nvidia ,近日, Google 向 Nvidia 發起了挑戰! Google I/O 在 2018 開發者大會期間發布了第三代 AI 人工智能 / 機器學習專用處理器 TPU 3.0 , TPU 3.0 的計算能力最高可達 100PFlops( 每秒 1000 萬億次浮點計算 ) ,是去年 TPU 2.0 的 8 倍多。
TPU (即: Tensor Processor Unit )是 Google 研發的針對深度學習加速的一款機器學習定制的專用晶片 (ASIC) ,專為 Google 的深度學習框架 TensorFlow 而設計。第一代 TPU 僅能用於推斷,去年 5月 Google 發布了 TPU 2.0 。
因為從 TPU 1.0 到 TPU 2.0 Google 並沒急於推進 TPU 晶片的商業化,而是做了大量的生態系統培育工作。當然 TPU 作為一種 ASIC 晶片方案,意味著其巨大的研發投入和市場風險,而其背後也潛在巨大市場。
此次 TPU 3.0 與傳統 GPU 圖像處理器不同,使用了 8bit低精度計算節省晶體管,即對精度影響小,又能節約功耗、加快速度,更多技術細節還有脈動陣列設計,優化矩陣乘法與卷積運算,並使用更大的偏上內存,減少對系統內存的依賴等等,此後 Google 會一一發布。據悉 TPU 3.0 首次使用水冷散熱,可以更高效地服務數據中心,便於定制硬件方案。