- 首頁
- 民文
- English
- 網(wǎng)站無障礙
- 舉報
- 登錄
上海AI企業(yè)發(fā)布全球首個混合架構(gòu)開源模型

人民網(wǎng)上海6月18日電 6月17日,總部位于上海徐匯的AI企業(yè)MiniMax(稀宇科技)正式發(fā)布其自主研發(fā)的MiniMax-M1系列模型,M1被定義為“全球首個開源的大規(guī)?;旌霞軜?gòu)推理模型”。
技術(shù)報告顯示,M1模型在處理百萬級Token的長文本上實現(xiàn)了重大突破,支持高達100萬Token的上下文窗口,成為上下文最長的推理模型。此外,它還支持8萬Token推理輸出,為處理復雜文檔分析、長篇代碼生成等任務提供了可能性。
開源技術(shù)報告截圖
MiniMax-M1的卓越性能,根植于其獨特的架構(gòu)設計和算法創(chuàng)新。其中,兩大核心技術(shù)——線性注意力機制混合構(gòu)架和更快的強化學習算法,構(gòu)成了其高效能、低成本的基石。
分析人士認為,MiniMax此舉不僅為開發(fā)者和企業(yè)提供了一個高性能、低門檻的新選擇,也用事實證明了通過技術(shù)創(chuàng)新可以有效打破“算力-資本”的壁壘。這種“卷成本、卷效率”的競爭模式,將倒逼更多模型廠商走向真正的技術(shù)驅(qū)動和價值創(chuàng)造,而非停留在參數(shù)和估值的虛假繁榮中。
據(jù)了解,完整的M1模型權(quán)重、技術(shù)報告均已在Hugging Face和GitHub上開放獲取。同時,公司正積極與國家超算平臺、vLLM等業(yè)界主流開源框架合作,以確保開發(fā)者能夠輕松、高效地部署和使用M1模型。
MiniMax相關(guān)負責人表示,M1的發(fā)布僅僅是MiniMax“開源周”的序幕。在接下來的四個工作日里,MiniMax計劃每天發(fā)布一項新的技術(shù)或產(chǎn)品更新,持續(xù)為AI社區(qū)帶來驚喜。
分享讓更多人看到