周浩能給千問帶來什麼?答案就在他為Gemini所做的工作之中
核心方法論:早期融合語義與視覺理解
這套架構和周浩在VideoPrism上做的事情高度一致,他們都是通過早期融合讓模型同時學會語義理解和視覺細節。周浩對這套方法論的深度理解,有望幫助千問在視頻理解與生成方面取得突破。
AI的“計劃執行”能力
周浩做的事,是讓AI學會“一口氣想好幾步”。AI會先拆解問題、制定計劃,然後一步步執行,每走一步都回頭檢查“這步走對了嗎?”,這種結構化思維模式有助於提升AI在複雜任務中的決策能力。
背景與職業軌跡
2026年1月,周浩低調加入阿里,第一站不是直接參與產品,而是深入技術架構層面。他的加入,被視作對千問模型能力提升的重要推動。
