梁文锋署名,DeepSeek发布最新论文
2026-06-28 15:14   
来源: 云财经   
影响力评估指数:24.4  
云财经讯,在6月中旬获得500亿融资后仅十几天,6月27日,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。这不是一次模型版本的迭代,而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块,重点在于工程落地层面的优化。随DSpark一同开源的DeepSpec,是一个用于训练和评估推测解码草稿模型的全栈代码库,包含数据准备工具、草稿模型实现、训练代码和评估脚本,支持MIT许可。目前DeepSpec已内置DSpark、DFlash和Eagle3三种实现。值得注意的是,DeepSeek创始人梁文锋位列论文作者名单。在完成首轮融资的当下,创始人依然亲自参与技术论文撰写,这在AI行业并不多见。
| 新闻标题 | 时间 | 消息来源 | 新闻热度 |
|---|---|---|---|
| 机器人“上岗” 厦金大桥(厦门段)环岛路隧道左线盾构始发 | 06-27 18:18 | 云财经 |
|
| 资本市场“光谷板块”总市值突破1.8万亿 | 06-27 10:36 | 云财经 |
|
| vivo X Fold6发布 支持一屏同开4个前台应用 | 06-26 20:39 | 云财经 |
|
| 黄金跌破4000美元的六大因素 | 06-26 16:27 | 云财经 |
|
| 鹏翎股份与艾曼斯签订战略合作协议 | 06-26 14:04 | 云财经 |
|
| 招商蛇口60.9亿元摘得杭州永久河宅地 成交楼面价51577元/平 | 06-26 13:45 | 云财经 |
|