Microsoft 於週二的年度 Build 活動中揭露七款全新 AI 模型,宣稱在盲測與影像編輯基準測試中,其表現優於 Anthropic 的 Claude Sonnet 4.6 以及 Google 的 Nano Banana 2。此次發布代表微軟的努力,欲讓自己成為前沿 AI 開發者,而不只是 OpenAI 最大的支持者與基礎設施供應商。此公告亦逢領先 AI 開發者之間的競爭持續加劇,因 Anthropic 與 Google 近期相繼推出自家旗艦模型。 MAI-Thinking-1 在盲測中超越 Claude Sonnet 4.6 根據微軟 AI 執行長 Mustafa Suleyman 的說法,MAI-Thinking-1 為微軟的旗艦文字基礎模型,在由獨立評估者進行的盲測中,相較於 Anthropic 的 Claude Sonnet 4.6 更受青睞。該模型在 AIME 2025 的得分為 97%,這是一項衡量進階問題解決與推理能力的指標。Suleyman 表示,該模型的 SWE Bench Pro 成績讓它「在最艱難的程式碼基準測試之一上,與 Opus 4.6 並駕齊驅」。微
唐納·川普總統週二簽署了一項行政命令,目標是以先進的人工智慧工具強化美國的資安,同時擴大聯邦機關與領先 AI 公司之間的合作。該命令名為「推動先進人工智慧創新與安全」,建立一個自願性的框架,用於在更廣泛發布前識別並審查強大的 AI 模型;開發者可在釋出給可信合作夥伴之前,將模型提交政府以供評估,時間最多可達 30 天。此舉在考量國家安全的同時,回應不斷演進的 AI 能力所帶來的變化,並力圖維持美國的科技優勢。此次簽署發生在川普於 5 月延後類似提案數週之後;當時他表示該提案的部分內容可能會拖慢美國的 AI 發展,並削弱美國在與中國競爭中的地位。 行政命令建立自願性的 AI 模型審查流程 該行政命令指示各機關加速使用由 AI 驅動的資安工具,建立 AI 資安清算中心(clearinghouse),並建立一套用於識別先進 AI 模型的流程。該命令指出:「先進的 AI 能力讓我們的國家更強,但也引入新的國家安全考量,這需要跨越行政部門與機關(agencies)以及各組成單位的協調行動。」 各機關將建立一個機密審查流程;在此流程下,美國國家安全局(National Security Agenc