據外媒報導,繼 Google 人工智能子公司 DeepMind 開發教 AI 如何玩電子遊戲的系統後,先又推出一款可以更好地「看到」並理解空間與環境的視覺系統,還因此成為了各大媒體的頭條。

這個人工智能視覺系統能夠基於一張 2D 照片,來推斷出一個 3D 場景模型。 從不同的角度拍攝場景都可以建立 3D 視圖,是因為這是通過使用大量由人類產生的、帶註釋的圖像來訓練的最先進的視覺識別系統,但是就只有總體內容的一小部分場景被捕獲,大大地限制了使用這些數據進行培訓的 AI 視覺系統。

另外,即便沒有相關學習經驗或知識,它也可以處理很多新鮮事物,甚至用來猜測和想像,以便能更好地了解周圍的環境,例如學習諸如透視和光線這類知識。雖然聽起來不大可靠,但是能讓機器學習根據教導想像,根據其所「見到」的信息來猜測,從而變得有更接近人類的感覺,將是重大的突破。

基於一張 2D 照片,來推斷出一個 3D 場景模型

在技術投入實踐和市場之前將會作出更多的實驗與研究,但是其已邁出一大步,相信「完全自主的場景理解」不需要靠著人類教導的 AI 視覺系統將很快實現。

立即 Follow:Qooah IG (@qooah)Qooah YouTube,八掛產品發佈會現場,睇盡靚靚 Show Girls