Skip to main content

分布式Llama:该项目证明可以将 LLMs 的工作负载分散到多个设备上并实现显着的加速