Skip to main content
SwiftInfer:基于TensorRT实现的Streaming-LLM技术,旨在支持LLM模型进行无限输入长度的推理
黑洞资源笔记
15:05 · Jan 12, 2024 · Fri
×
SwiftInfer
:基于TensorRT实现的Streaming-LLM技术,旨在支持LLM模型进行无限输入长度的推理