面向尖端大型语言模型（LLM）推理优化的灵活框架，提供高级内核优化和放置/并行策略体验，支持本地部署和资源受限环境KTransformers | #框架

15:28 · Jul 28, 2024 · Sun

面向尖端大型语言模型（LLM）推理优化的灵活框架，提供高级内核优化和放置/并行策略体验，支持本地部署和资源受限环境

KTransformers | #框架