第一步
第二步
第三步
第四步
第五步
//弹窗容器

MiniMax开源首个Coding Agent评测集

2026-01-14 11:48    来源: 云财经    影响力评估指数:22.67  
云财经讯,MiniMax正式开源首个面向 Coding Agent 的系统性评测集OctoCodingBench。评测结果显示,部分开源模型在过程合规指标上已快速逼近甚至超越部分闭源模型,反映出在 Agent 时代,“数据与评测范式”的重要性正在上升为新的竞争要素。