最近幾年,隨著機器學習加速器的飛速發展,已經涉及到了移動設備領域,其中有高通、海思、聯發科和 Samsung LSI 等廠商在研發中。就在日前,ARM 在發布全新的 Cortex-A78、Cortex-X1 CPU、Mali-G78 GPU 三款架構的同時,還揭露了一些最新 Ethos-N78 NPU 的消息。
據悉,ARM 的「Ethos」機器學習針對於客戶端推理工作負載,第一款設計為 Ethos-N77,至今已經過去了一年。時至今日,ARM 經過進一步的研發,帶來了全新的 Ethos-N78 及其「Scylla」架構。
根據官方的介紹,得知 N78 性能和效率都有非常大的提升,已經可以實現在高達 10TOPs 原始計算吞吐量下的 2倍峰值性能。並且在改進 NPU 設計後,採用新壓縮技術,每條推理的外部頻寬提升40%。值得注意的是,N78 的強項是在不同配置選項中的性能擴展能力,擁有4個不同的性能點。
「Scylla」架構的改進之處為引擎中處理數據的方式,這樣不僅可以採用全新的壓縮方式,還能提升 DRAM 頻寬,對 NPU 內部的數據進行移動,有效提升能耗比。
對於 ARM 公司的新 Ethos-N78 晶片,據悉已經授權給了客戶,進入了設計階段。第一批採用該晶片的設備有望在2021年推出市場。