字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

4月10日，字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集——Multi-SWE-bench，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

广告等商务合作，请点击这里

未经正式授权严禁转载本文，侵权必究。

打开界面新闻APP，查看原文

打开界面新闻，查看更多专业报道

字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

热门评论

热门推荐

字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

相关推荐

热门评论

热门推荐