test2_MiniMax M2.5发布:性能比肩Claude Opus 4.6,输入价格约0.3美元/百万Token_足球比赛预测
新浪科技讯 2月13日上午消息,发布MiniMax上线新一代文本模型MiniMax M2.5。比肩在编程能力方面,输入足球比赛预测M2.5在权威榜单SWE-Bench Verified得分80.2%、价格Multi-SWE-Bench得分51.3%,约美元百较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6,发布达到了行业最好的比肩水平。更重要的输入是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,价格更接近真实架构师的约美元百工作模式。
在工具调用和搜索能力方面,发布足球比赛预测模型能够自动处理复杂任务,比肩在BrowseComp、输入Wide Search等多项 Agent 任务中以更低的价格轮次消耗取得了更优的效果,相较于上一代模型表现提升20% ,约美元百达到了行业顶尖水平。
办公场景中,在 Word、PPT、Excel 金融建模等 Workspace 高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了 59.0%的平均胜率。
性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。
这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。
目前,M2.5已在 MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。(文猛)

海量资讯、精准解读,尽在新浪财经APP 责任编辑:杨赐
相关文章:
- 智谱GLM再度提价10%,公司股价涨超14%
- 讯飞AI眼镜亮相MWC:集多模态同传翻译于一体,整机重量仅40克
- 小米卢伟冰:五年内人形机器人有望进入各类产线
- 千问核心负责人林俊旸最新回应:我真的需要休息 今日凌晨发文:退出千问,再见
- vivo X300 Ultra 发布 打破拍照与摄像的设备鸿沟
- 荣耀Robot Phone亮相MWC,CEO李健称将赋予手机“大脑”和“手脚”
- 鸿蒙智行处罚违规营销门店,涉事门店已公开致歉
- 荣耀Robot Phone亮相MWC,CEO李健称将赋予手机“大脑”和“手脚”
- 储能头部企业谈价格走势:短期上涨、长期缓慢下降,行业转向价值竞争
- BOE(京东方)“智启新程 X 科技创新”跨界对话在京举行:以显示创新为支点,撬动高质量发展新动能
相关推荐:
- 余承东批评团队零售设计没做好:核心原因出在审美上,要加快提升审美鉴赏水平
- “千问AI眼镜”预计3月底开放外卖功能,2026年全面进军国际市场
- 小米卢伟冰回应“内存涨价”:预计将持续到2027年底,历史从未有过
- 前千里智驾首席科学家秦海龙加入Vbot维他动力,任研发副总裁
- 西门子CEO博乐仁:将AI带入现实世界,更需要工业AI“操作系统”
- 联想moto首款“大折叠”手机MWC亮相,即将国内发布
- vivo X300 Ultra全球首秀,搭载行业最远400mm增距镜
- 何小鹏:小鹏第二代VLA比行业第一梯队领先接近5倍
- 小马智行:2025年营收6.29亿元,Robotaxi收入翻番
- 同程旅行:针对中东地区局势启动应急保障机制
- 华为聂奕:乾崑智驾累计辅助驾驶里程达95.6亿公里,活跃用户占比94.8%
- 清华AIR联合水木分子开源OpenBioMed Skills,含45项生物医学技能
- vivo X300 Ultra及X300s正式发布,售价4999元起
- 首部AIGC国宝文物科普少儿动画开播 芒果TV AIGC创新内容中心制作出品
- 名创优品寇维宣:锚定全球领先的IP运营平台,以乐园系大店布局全球旅游零售
- 美图RoboNeo接入Seedance2.0
- 千问“深度研究”升级:接入1.3万股票实时行情,免费开放使用
- 美图首席产品官陈剑毅:生产力场景产品是增长核心
- 从“充电焦虑”到“充电友好”:比亚迪闪充站如何重塑补能生态?
- 千问“深度研究”升级:接入1.3万股票实时行情,免费开放使用
