Google 宣佈推出名為 FunctionGemma 的專用模型。該模型基於 Gemma 3 270M 進行微調,將函數調用能力引入智能手機等邊緣裝置。開發者越來越希望模型能夠在裝置端直接處理用戶指令,減少對雲端計算的依賴。FunctionGemma 正是為此設計,它在保持 Gemma 系列輕量化特點的同時,經過專門改善,使得手機及嵌入式設裝置能夠精准理解用戶需求,並自主調用相應功能,實現快速響應。

與通用的大型語言模型不同,FunctionGemma 專注於定制化任務處理。它不僅支援自然的人機對話,還能生成結構化的函數調用代碼,從而直接操作裝置或應用程式。在 Google 內部的「移動操作」測試中,該模型表現出優秀的適應能力:未微調前執行指令的準確率為 58%,而經過定向提升後,在完成「預約午餐並添加日曆」「將昨日拍攝的美食照片發送給家人」這類複雜任務時,準確率提升至 85%。

為了在算力與電量受限的邊緣裝置上實現高效運行,FunctionGemma 採用了高度輕量化的設計。它借助 Gemma 原有的 256k 詞表,能夠高效解析 JSON 數據與多語言輸入,降低處理延遲。目前,該模型已適配 NVIDIA Jetson Nano 等嵌入式開發板以及主流移動裝置,甚至可作為「任務調度器」,自行處理簡單操作,並將複雜邏輯交由更大的 Gemma 3 27B 模型處理。

為方便開發者使用,Google 圍繞 FunctionGemma 構建了完整的工具生態。開發者現已可通過 Hugging Face、Kaggle 等平台獲取模型,並利用 Unsloth、Keras 或 NVIDIA NeMo 等框架進行定制微調。模型支援LiteRT-LM、vLLM、Llama.cpp 及 Ollama 等多種推理工具。此外,Google還發佈了 TinyGarden 遊戲示例與「移動操作」微調指南,演示如何通過自然語言控制虛擬農場或手機設定,助力開發者快速構建低延遲、本地化的端側智能體。

 

_______

更多平台立即 Follow:Qooah IG (@qooah)Qooah YouTube,八掛產品發佈會現場,睇盡靚靚 Show Girls