• 为什么说男人至死都是少年?
  • 5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
  • 是什么原因让你一定要用 iPhone?
  • 不是都说6月美债要爆吗 怎么没消息了?
  • 阿里网盘为什么没有动静了?

诚信为本,市场在变,诚信永远不变...        

0896-98589990
新闻资讯
您的当前位置: 首页 > 新闻资讯

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

发布时间:2025-06-18 00:50:11

分享到:

卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。

Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

上一篇 : 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

下一篇 : 如何以“我是恶毒女配,但我摆烂了”为开头写一篇文?