
(台泰時報5月12日電)Google DeepMind近日發布最新研究「AI Co-Mathematician:Accelerating Mathematicians with Agentic AI」,推出可與數學家共同進行研究的AI系統,引發全球數學與人工智慧領域高度關注。
不同於過去僅能解題或證明定理的AI模型,這套「AI Co-Mathematician」被定位為「AI共同研究員」,能參與完整研究流程,包括提出問題、查找文獻、測試假設、撰寫程式、驗證結果與整理研究內容。
Google DeepMind指出,現有數學AI雖已具備推理與定理證明能力,但仍難以處理真實研究中反覆試錯、修正假設與長期追蹤等複雜流程,因此開發具「stateful workspace」能力的新系統,可保存研究過程、失敗紀錄與實驗歷史,方便研究人員持續追蹤與修正。
系統最大特色之一,是採用「Agentic AI」架構,由多個AI代理(Agents)分工合作。其中「Project Coordinator Agent」負責統籌研究方向與分配任務,其餘AI則各自負責文獻搜尋、程式撰寫、理論分析與結果驗證。
此外,系統也導入「review loop」機制,由多個AI Reviewer交叉檢查邏輯、程式與引用資料,以降低大型語言模型常見的錯誤生成(hallucination)問題。
Google DeepMind透露,該系統已與多位專業數學家合作測試,部分案例甚至成功協助解決研究級數學問題。例如在群論(group theory)領域中,AI曾協助數學家Marc Lackenby處理《Kourovka Notebook》中的開放問題,提出初步證明方向,再由研究人員補足細節完成正式證明。
另一案例則涉及Stirling coefficients猜想,系統不僅協助建立計算證據,也發現原有假設部分錯誤,並提出更精確的新方向。
在效能測試方面,AI Co-Mathematician於研究級數學測試「FrontierMath Tier 4」取得48%成績,創下目前數學AI系統最高紀錄,明顯高於Gemini 3.1 Pro基礎版本。
不過,Google DeepMind也坦言,系統仍存在限制,包括AI之間可能共同接受錯誤答案、陷入無限討論循環,或產生看似合理但邏輯有缺陷的研究內容。
研究團隊同時警告,未來AI可能大量生成學術論文,增加低品質研究內容,進一步加重學術界同行審查(peer review)壓力。
Google DeepMind強調,AI Co-Mathematician的目標並非取代數學家,而是成為研究夥伴,協助人類更快速探索複雜理論與新知識。
圖片來源:Thansettakij
