IT之家 6 月 3 日消息,在 Build 2026 開發(fā)者大會(huì)上,微軟發(fā)布了一系列自研 AI 模型,其中包括旗下首款高級(jí)推理模型 MAI-Thinking-1。這也是微軟在模型研發(fā)領(lǐng)域邁出的重要一步。
微軟介紹稱,MAI-Thinking-1 是一款“中等規(guī)模模型”,擁有 350 億活躍參數(shù),在關(guān)鍵軟件工程基準(zhǔn)測(cè)試中能夠達(dá)到業(yè)界領(lǐng)先模型的水平。微軟表示,該模型“完全基于干凈數(shù)據(jù)從零開始訓(xùn)練,未使用來(lái)自第三方模型的蒸餾數(shù)據(jù)”。
除 MAI-Thinking-1 外,微軟還公布了多款面向不同應(yīng)用場(chǎng)景的新模型,覆蓋圖像生成、語(yǔ)音轉(zhuǎn)寫、語(yǔ)音合成以及編程輔助等領(lǐng)域。IT之家匯總?cè)缦拢?/p>
在圖像領(lǐng)域,微軟發(fā)布了 MAI-Image 2.5 及其 Flash 版本,兩者均支持文生圖和圖像編輯功能。
語(yǔ)音轉(zhuǎn)寫方面,微軟推出 MAI-Transcribe-1.5,并表示該模型“速度可達(dá)競(jìng)爭(zhēng)對(duì)手模型的五倍”。
語(yǔ)音能力方面,微軟發(fā)布了 MAI-Voice-2,同時(shí)預(yù)告其 Flash 版本即將推出。微軟稱,新模型新增了對(duì) 15 種語(yǔ)言的支持,并提供更多語(yǔ)音選項(xiàng)。
針對(duì)編碼場(chǎng)景,微軟推出了 MAI-Code-1。微軟表示,該模型具備“推理效率優(yōu)化”特性,并已集成到 GitHub Copilot 和 Visual Studio Code 中。
通過(guò)此次發(fā)布,微軟進(jìn)一步擴(kuò)展了自研 MAI 模型家族,覆蓋推理、圖像、語(yǔ)音和編程等多個(gè) AI 應(yīng)用方向。
相關(guān)閱讀:
微軟 Build 2026 開發(fā)者大會(huì)專題
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。