在线观看国产精品va_国产成人精品怡红院在线观看_亚洲精品1卡2卡三卡23卡_女人夜夜春高潮爽a∨片_久久激情日本亚洲欧洲国产中文_国产亚洲精品a在线观看下载

深圳熱線

又一國產大模型剛剛開源!能使喚機器狗拿水

2025-12-26 21:09:04 來源:智東西

智東西作者 陳駿達編輯 心緣


(資料圖)

MiniMax最強編程模型開源了!

智東西12月26日報道,今天下午,MiniMax開源了其本周二發布的MiniMax M2.1模型,該模型主打編程能力和辦公場景的可用性,在多語言編程、Agent、復雜指令方面都有明顯提升。

MiniMax M2.1采用MoE(混合專家)架構,參數量為229B,激活參數量為10B,與此前開源的MiniMax M2一致。

在編程相關場景的核心榜單上,MiniMax M2.1相比于前代模型MiniMax M2的得分最高提升了60%(Terminal-bench 2.0)。尤其是在多語言場景上,MiniMax M2.1的表現甚至超過了Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5。

此外,為了考察模型“從零到一”構建完整、可運行應用程序的全棧能力,MiniMax構建并開源了全新基準測試VIBE。MiniMax-M2.1在VIBE綜合榜單中拿到88.6的平均分,得分接近Claude Opus 4.5,并在幾乎所有子集上都顯著優于Claude Sonnet 4.5。

在辦公場景、長程工具調用和綜合智能指數上,MiniMax M2.1 相比M2也表現出穩步提升,多項得分打平或超過Claude Sonnet 4.5和Gemini 3 Pro。

其實,發布之初,MiniMax就宣布MiniMax M2.1模型將會開源,過去幾天,MiniMax在與多個部署平臺對齊測試,并于今天全面開源權重。

用戶還可以在MiniMax開放平臺和MiniMax Agent上使用這一模型。MiniMax提供了M2.1和M2.1-lightning兩個版本的API,這兩個API結果完全一樣,但是后者速度更快,價格翻倍。

開源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M2.1

https://github.com/MiniMax-AI/MiniMax-M2.1

MiniMax Agent:

https://agent.minimaxi.com/

一、多語言和App開發成重點,打造3D手勢交互動畫效果驚艷

在編程場景,MiniMax M2.1把多語言和App開發作為重點。

在M2.1中,MiniMax系統性提升了模型在Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScript等編程語言上的能力。這些語言覆蓋從底層系統到應用層開發的完整鏈路。

官方案例中,MiniMax M2.1基于React Three Fiber與InstancedMesh構建了一顆“3D夢幻圣誕樹”,成功渲染7000+實例,支持手勢交互與復雜粒子動畫。可以看到,這顆“圣誕樹”能根據用戶的手勢散開或者聚攏,頁面效果流暢。

模型的多語言能力,擴展了模型在更復雜場景的應用。此前,主流模型在編程領域都存在偏科的現象,大部分模型更擅長Web端應用和網頁前端的開發,而MiniMax加強了M2.1的Android與iOS開發能力、設計理解與美學表達能力。

下方案例中,M2.1使用Kotlin語言開發了一款安卓原生重力感應模擬器,利用陀螺儀傳感器實現重力操控體驗,并設計了視覺彩蛋,通過自然的UI過渡與碰撞特效,呈現“MERRY XMAS MiniMax M2.1”信息。

iOS開發中,M2.1打造了一個桌面交互小組件,設計了“沉睡圣誕老人”點擊喚醒機制,邏輯完整且具備交互動畫效果。

為了理解辦公場景的復合指令約束,MiniMax此前已經為其模型引入了交叉思考(Interleaved Thinking)的能力。此次開源的M2.1在系統化問題解決方面的能力再次升級,執行任務時,模型不僅關注代碼執行是否正確,同時關注對“復合指令約束”的整合執行能力。

二、模型驅動機器狗行動,還能充當數字員工

MiniMax M2.1還具備較強的Agent能力。MiniMax官方展示了多個案例。

比如,MiniMax M2.1可以直接用于驅動機器狗,理解用戶“幫我去后面的吧臺那瓶水來”的需求。模型能理解壓力傳感器變化意味著物品已經被放置,然后轉身回去找用戶。

Agent能力還體現在模型的工具調用能力上。下方案例中,MiniMax M2.1能自主調用Excel工具和雅虎財經,完成市場調研數據清洗、分析和圖表生成任務。

MiniMax M2.1可以用于驅動數字員工。模型能夠接受以文字形式展示的網頁內容,并以文本形態的輸入控制鼠標的點擊行為和鍵盤輸入,在日常辦公場景下,完成行政、數據科學、財務、人力資源、軟件開發類的端到端任務。

比如,模型可以在通訊軟件上主動收集員工的設備請求,然后前往企業內部服務器上搜索相關文檔獲取設備價格,計算總成本并判斷部門預算是否充足,然后記錄設備變更。

或是在項目管理軟件上查找被阻塞或積壓的問題,然后在通訊軟件上查找相關員工并咨詢解決方案,根據員工反饋更新問題的狀態。

模型也可以在代碼庫中查找答案。例如,某同事希望知道改動了某個文件的最近的合并請求是哪一個,檢索相關的合并請求,找到編號并告知該同事。

結語:AI編程模型,持續深入生產級場景

隨著AI編程的不斷滲透,開發者和企業已經不再僅僅滿足將編程模型用于簡單的代碼補全或片段生成。

本周,MiniMax與智譜都發布了主打編程能力的新模型,并強調模型在生產級環境的可用性與處理復雜、復合任務的能力。

未來,模型能否更深入地融入開發工作流、安全穩定地完成端到端任務,將成為影響其價值的重要因素。

關鍵詞: 調用 編程 機器狗 應用程序 深度思考按

熱門推薦

主站蜘蛛池模板: 亚洲va韩国va欧美va | 激情综合五月天 | 日韩中文字幕av | 黄色成人免费视频 | 一区二区播放 | 黄色片免费网站 | 久久国产小视频 | 成人羞羞国产免费 | 五月综合色 | 91在线无精精品一区二区 | 国产精品一区av | 欧美成人精品一区二区三区在线看 | 永久久久久| 精品在线免费视频 | 久久中文字幕在线观看 | 国产一区二区三区视频在线播放 | 欧美成欧美va | 狠狠干2019| 在线性视频 | 韩国一级黄色片 | 欧洲精品在线观看 | 国产91在线高潮白浆在线观看 | 国产一区在线观看免费 | 国产一区二区网站 | 在线中文字幕播放 | 愉拍自拍 | 亚洲精品www久久久久久广东 | 成人黄色免费视频 | 午夜欧美精品 | 久久久久999| 在线免费观看你懂的 | 国产福利在线播放 | 国产精品一卡二卡 | 视频一区欧美 | 午夜播放 | 香蕉视频成人在线观看 | 日本va欧美va欧美va精品 | 9色在线视频 | 国产精品毛片久久 | 日韩高清在线观看 | 日本成人一级片 |