Skip to main content

面向尖端大型语言模型(LLM)推理优化的灵活框架,提供高级内核优化和放置/并行策略体验,支持本地部署和资源受限环境KTransformers | #框架

  1. 面向尖端大型语言模型(LLM)推理优化的灵活框架,提供高级内核优化和放置/并行策略体验,支持本地部署和资源受限环境

    KTransformers | #框架