InfiniStore:分布式LLM推理的高性能KV缓存存储,为大规模推理集群提供极致性能优化。

支持预填充-解码分离模式,提升集群效率;低延迟、高吞吐量,性能卓越;易于集成,支持多种LLM服务
 
 
Back to Top