LiveCodeBench是一个全面的、无污染的LLM评估基准,用于不断收集新问题的代码。特别是,LiveCodeBench还专注于更广泛的代码相关功能,例如自修复,代码执行和测试输出预测,而不仅仅是代码生成。