PawBench

任务库

150 个任务,全部公开 prompt、自动化检查代码与 LLM Judge rubric

共 150 个任务