
Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路
Table Of Contents

今年國際數學奧林匹克競賽(IMO)奪金的背後,藏著Google DeepMind的最新突破。IMO是全球最具影響力的數學競賽之一,此次奪金再次證明了Google DeepMind在人工智能領域的領導地位。這家全球頂尖的人工智能實驗室近日正式推出Gemini Deep Think模型,這款被譽為「先進推理引擎」的AI系統,能同時探索數種思路並最終篩選出最佳答案,其性能在多項國際標準測試中超越OpenAI及xAI等競爭對手。
此模型作為Google首個公開的多代理系統,採用了獨創的強化學習技術,並透過並行運算大幅提升複雜問題的處理效率。例如,在Humanity’s Last Exam(HLE)測試中,Gemini Deep Think未使用工具即取得34.8%的成績,遠超xAI的Grok 4(25.4%)及OpenAI的o3(20.3%)。而在程式設計競技場LiveCodeBench 6的測試中,該模型更以87.6%的表現優於其他對手。
此外,除了技術性能,Google亦指出,該模型能夠自動整合程式碼執行及網頁開發等功能,生成比傳統AI更詳細的回答。在測試中,Gemini Deep Think生成的網站開發方案內容更豐富,視覺效果也更精緻,有望加速學術研究進程。
值得注意的是,多代理系統的高昂運算成本可能促使科技巨頭將其限制在高階訂閱服務內。Google表示,目前僅向月費1950港元(約250美元)的Ultra訂閱用戶開放測試,而xAI及Anthropic等競爭對手亦採取類似策略。
目前,Google正透過Gemini API向學術界及企業開發者擴展測試範圍,並希望收集反饋以優化此系統在學術場景的應用。正如Google在部落格中所言:「Deep Think能協助人們解決需要創造力、策略規劃及逐步優化的問題。」
頂尖AI實驗室的技術趨勢
近年來,多代理系統逐漸成為AI研究的熱門方向。xAI早前推出的Grok 4 Heavy、Anthropic的Research agent等項目,均採用類似的架構。OpenAI研究員Noam Brown更在播客中透露,今年IMO奪金的未公開模型亦屬多代理系統。這一趨勢表明,各大科技公司都在積極開發和應用多代理系統,以提升AI的解決複雜問題的能力。
香港創科界關注技術應用
香港科技園公司(HKSTP)指出,這類AI技術的發展將為本地人工智慧產業注入新動力,特別是多代理系統在學術研究及企業開發中的潛力。然而,專家亦提醒,技術門檻與成本控制仍是推廣的關鍵挑戰。目前,許多本地機構正在積極探索如何應用這些技術,以提升競爭力。
產業觀點:技術與商業的平衡
香港生產力局(HKPC)科技顧問李偉強指出:「多代理AI的突破令人鼓舞,但如何降低使用成本、提升普及性,才是技術落地的關鍵。」他預計未來將有更多本地機構與Google合作探索應用場景。根據最近的一項調查,超過70%的本地企業表示有意引入多代理AI技術,但成本是主要障礙。