首頁
黨政
- 黨網(wǎng) · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陜
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網(wǎng)站
人工智能
人民網(wǎng)客戶端
網(wǎng)站無障礙
舉報
登錄

上海AI企業(yè)發(fā)布全球首個混合架構(gòu)開源模型

2025年06月18日10:07 | 來源：人民網(wǎng)－上海頻道

小字號

人民網(wǎng)上海6月18日電 6月17日，總部位于上海徐匯的AI企業(yè)MiniMax（稀宇科技）正式發(fā)布其自主研發(fā)的MiniMax-M1系列模型，M1被定義為“全球首個開源的大規(guī)?；旌霞軜?gòu)推理模型”。

技術(shù)報告顯示，M1模型在處理百萬級Token的長文本上實現(xiàn)了重大突破，支持高達100萬Token的上下文窗口，成為上下文最長的推理模型。此外，它還支持8萬Token推理輸出，為處理復雜文檔分析、長篇代碼生成等任務提供了可能性。

開源技術(shù)報告截圖

MiniMax-M1的卓越性能，根植于其獨特的架構(gòu)設計和算法創(chuàng)新。其中，兩大核心技術(shù)——線性注意力機制混合構(gòu)架和更快的強化學習算法，構(gòu)成了其高效能、低成本的基石。

分析人士認為，MiniMax此舉不僅為開發(fā)者和企業(yè)提供了一個高性能、低門檻的新選擇，也用事實證明了通過技術(shù)創(chuàng)新可以有效打破“算力-資本”的壁壘。這種“卷成本、卷效率”的競爭模式，將倒逼更多模型廠商走向真正的技術(shù)驅(qū)動和價值創(chuàng)造，而非停留在參數(shù)和估值的虛假繁榮中。

據(jù)了解，完整的M1模型權(quán)重、技術(shù)報告均已在Hugging Face和GitHub上開放獲取。同時，公司正積極與國家超算平臺、vLLM等業(yè)界主流開源框架合作，以確保開發(fā)者能夠輕松、高效地部署和使用M1模型。

MiniMax相關(guān)負責人表示，M1的發(fā)布僅僅是MiniMax“開源周”的序幕。在接下來的四個工作日里，MiniMax計劃每天發(fā)布一項新的技術(shù)或產(chǎn)品更新，持續(xù)為AI社區(qū)帶來驚喜。

(責編：唐小麗、軒召強)

分享讓更多人看到