DeepSeek团队;清北;DualPath系统;智能体推理存储瓶颈

DeepSeek团队联合清北发布DualPath系统,打破智能体推理存储瓶颈

近日,DeepSeek团队联合清华大学、北京大学计算机学院发表名为《DualPath:突破智能体LLM推理中的存储带宽瓶颈》的论文。针对智能体LLM推理中的KV-Cache存储瓶颈,论文提出DualPath系统。该系统打破传统单一存储到预填充路径,引入创新的存储到解码路径,利用闲置带宽并配合全局动态调度。实验显示,其在线推理吞吐量平均提升达1.96倍。

    广告等商务合作,请点击这里

    未经正式授权严禁转载本文,侵权必究。

    打开界面新闻APP,查看原文
    界面新闻
    打开界面新闻,查看更多专业报道

    热门评论

    打开APP,查看全部评论,抢神评席位

    热门推荐

      下载界面APP 订阅更多品牌栏目
        界面新闻
        界面新闻
        只服务于独立思考的人群
        打开