Perplexity MoE Kernels:高效优化的Perplexity GPU内核,为大规模并行计算加速。

支持Cuda Graph,提升计算效率;通信与计算重叠,性能提升显著;兼容多种传输层,如NVLink、IBGDA等,灵活适配不同硬件环境
 
 
Back to Top