Skip to main content
分布式LLama3推理助手:基于Rust实现的分布式大型语言模型(LLM)推理框架,专为解决单一设备GPU内存不足而设计,支持多设备协同推理
黑洞资源笔记
14:43 · Jul 14, 2024 · Sun
×
分布式LLama3推理助手
:基于Rust实现的分布式大型语言模型(LLM)推理框架,专为解决单一设备GPU内存不足而设计,支持多设备协同推理