谷歌Gemma 4實測:手機斷網也能用,但邏輯題竟全軍覆沒
模型背景與發佈
谷歌正式發佈了旗下最新開源大模型家族Gemma 4,這是谷歌入局開源AI賽道兩年多來,拿出的最有誠意、也最具殺傷力的作品。Gemma 4不是單一模型,而是一套覆蓋手機到工作站全尺寸的模型家族,從能塞進手機的2B,到可以單卡跑滿的31B,四個尺寸全覆蓋,全部基於Gemini 3同源架構。
端側部署與離線能力
Gemma 4沿用了Gemini 3的架構底座,旨在處理複雜推理,並支持在手機等低功耗設備上運行自主AI Agent。其核心升級點包括:推理邏輯進化,全系模型針對複雜推理進行優化,支持在手機等終端設備上實現離線運行,即使在斷網環境下也能執行多模態任務。
實測表現與侷限
- 在手機端離線測試中,Gemma 4展現出良好的多模態處理能力與響應速度,驗證了其在低功耗設備上的可行性。
- 然而,在邏輯推理類任務的測試中,模型表現不佳,出現「全軍覆沒」的情況,未能有效完成複雜邏輯題。
- 有實測報告指出,鴻蒙系統在部分場景下表現優於其他系統,可能與系統優化有關。
技術意義與市場影響
儘管在邏輯推理方面存在明顯短板,Gemma 4仍標誌著端側AI模型的重大突破,為個人設備上的自主AI Agent發展鋪平道路。未來隨著模型優化與訓練數據提升,其在複雜任務中的表現有望改善。
