DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。

性能卓越,部分场景速度提升高达2.7倍;代码简洁,核心功能仅约300行代码;支持混合专家模型(MoE),适配多种矩阵形状
 
 
Back to Top