上云资讯 - 来上云吧，企业上云一站式服务

2024-12-11 19:13:31 232人关注

字节开源全新代码大模型评估基准“FullStack Bench”

12月5日，字节豆包大模型团队推出了最新的代码大模型评估基准——FullStack Bench，涵盖了超11类真实场景，支持16种编程语言，并包含3374个问题。这一基准相比之前的评估标准，在更广泛的编程领域中能更准确地评估大模型的代码开发能力，推动了模型在现实世界编程任务中的优化。