Tai-Thai Times 台泰時報 - 字字正體，句句真心，連接台灣泰國與全世界

（台泰時報5月12日電）Google DeepMind近日發布最新研究「AI Co-Mathematician：Accelerating Mathematicians with Agentic AI」，推出可與數學家共同進行研究的AI系統，引發全球數學與人工智慧領域高度關注。

不同於過去僅能解題或證明定理的AI模型，這套「AI Co-Mathematician」被定位為「AI共同研究員」，能參與完整研究流程，包括提出問題、查找文獻、測試假設、撰寫程式、驗證結果與整理研究內容。

Google DeepMind指出，現有數學AI雖已具備推理與定理證明能力，但仍難以處理真實研究中反覆試錯、修正假設與長期追蹤等複雜流程，因此開發具「stateful workspace」能力的新系統，可保存研究過程、失敗紀錄與實驗歷史，方便研究人員持續追蹤與修正。

系統最大特色之一，是採用「Agentic AI」架構，由多個AI代理（Agents）分工合作。其中「Project Coordinator Agent」負責統籌研究方向與分配任務，其餘AI則各自負責文獻搜尋、程式撰寫、理論分析與結果驗證。

此外，系統也導入「review loop」機制，由多個AI Reviewer交叉檢查邏輯、程式與引用資料，以降低大型語言模型常見的錯誤生成（hallucination）問題。

Google DeepMind透露，該系統已與多位專業數學家合作測試，部分案例甚至成功協助解決研究級數學問題。例如在群論（group theory）領域中，AI曾協助數學家Marc Lackenby處理《Kourovka Notebook》中的開放問題，提出初步證明方向，再由研究人員補足細節完成正式證明。

另一案例則涉及Stirling coefficients猜想，系統不僅協助建立計算證據，也發現原有假設部分錯誤，並提出更精確的新方向。

在效能測試方面，AI Co-Mathematician於研究級數學測試「FrontierMath Tier 4」取得48％成績，創下目前數學AI系統最高紀錄，明顯高於Gemini 3.1 Pro基礎版本。

不過，Google DeepMind也坦言，系統仍存在限制，包括AI之間可能共同接受錯誤答案、陷入無限討論循環，或產生看似合理但邏輯有缺陷的研究內容。

研究團隊同時警告，未來AI可能大量生成學術論文，增加低品質研究內容，進一步加重學術界同行審查（peer review）壓力。

Google DeepMind強調，AI Co-Mathematician的目標並非取代數學家，而是成為研究夥伴，協助人類更快速探索複雜理論與新知識。

圖片來源：Thansettakij　

Google DeepMind推AI研究夥伴 數學界掀震撼

Google DeepMind推AI研究夥伴　數學界掀震撼