15:28 · Jul 28, 2024 · Sun 面向尖端大型语言模型(LLM)推理优化的灵活框架,提供高级内核优化和放置/并行策略体验,支持本地部署和资源受限环境KTransformers | #框架