黑洞资源笔记
15:26 · Feb 26, 2025 · Wed
DeepGEMM
:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。
性能卓越,部分场景速度提升高达2.7倍;代码简洁,核心功能仅约300行代码;支持混合专家模型(MoE),适配多种矩阵形状
Home
Powered by
BroadcastChannel
&
Sepia