黑洞资源笔记
14:13 · Apr 8, 2025 · Tue
InfiniStore
:分布式LLM推理的高性能KV缓存存储,为大规模推理集群提供极致性能优化。
支持预填充-解码分离模式,提升集群效率;低延迟、高吞吐量,性能卓越;易于集成,支持多种LLM服务
Home
Powered by
BroadcastChannel
&
Sepia