通义实验室推出通用智能体评测基准PawBench
2026-06-05 18:44   
来源: 云财经   
影响力评估指数:22.85  
云财经讯,通义实验室推出评测基准PawBench,v1.0版本已开源。它面向个人助理与通用智能体场景,将底座模型与运行框架(Harness)纳入同一评测体系。据介绍,PawBench不是单纯做一个模型排行榜,而是把“模型、Harness、任务”三者放在一起做交叉评测。
| 新闻标题 | 时间 | 消息来源 | 新闻热度 |
|---|---|---|---|
| 和顺电气:预中标国家电网两项目,合计金额2.37亿元 | 今天 16:42 | 云财经 |
|
| 凯赛生物、隆基绿能、森特股份、招商租赁签署四方战略合作协议 | 今天 11:04 | 云财经 |
|
| 厄尔尼诺带来丰水预期,南方水电公司迎景气行情 | 今天 06:25 | 云财经 |
|
| Anthropic总裁认为:高昂的计算成本是推动公司IPO的主因 | 今天 03:35 | 云财经 |
|
| 沙特阿拉伯计划到2040年将磷肥产量提高两倍 | 今天 01:45 | 云财经 |
|
| 永安药业:2025年度权益分派,每10股派1元(含税) | 06-04 18:12 | 云财经 |
|