爱可可-爱生活
24-12-06 21:19 微博认证:AI博主 2025微博新锐新知博主

【KernelBench:用于评估大语言模型(LLM)编写GPU内核能力的基准测试工具。提供4个级别的测试类别,包括单内核运算符、简单融合模式、完整模型架构和HuggingFace模型优化。可测试LLM将PyTorch算子转译为CUDA内核的能力,并评估生成代码的编译、正确性和性能】
'KernelBench - Can LLMs Write GPU Kernels? A benchmark for evaluating LLMs' ability to generate GPU kernels'
GitHub: github.com/ScalingIntelligence/KernelBench
#GPU编程# #深度学习# #性能优化# #基准测试#

发布于 北京