黑洞资源笔记
- E2B Infra -E2B基础设施:AI Agent和应用的安全运行时,为云环境提供动力,支持AI Agent的定制和管理
-
- Chronos:基于语言模型架构的概率时间序列预测预训练模型,能将时间序列数据转化为Token序列,并通过交叉熵损失训练语言模型,实现多轨迹采样以获得概率预测分布
-
-
-
-
- GPUStack:开源GPU集群管理器,用于运行大型语言模型(LLM),支持多种硬件平台,提供轻量Python包和OpenAI兼容API,简化用户和API密钥管理,实时监控GPU性能和利用率
-
-
-
- Kubernetes上部署大型语言模型的自动化工具,支持本地快速启动和运行。支持CPU和GPU(尤其是NVIDIA和AMD)的稳定部署,但并非所有GPU都受支持
Ollama Helm Chart | #工具 -
-
- Zenbase Core:生产环境中自动化的提示工程库,专为软件工程而设计,将斯坦福NLP的DSPy项目研究成果转化为实际工程需求,帮助开发者在生产环境中部署自动提示优化
-
- ASTRA.ai:无需编码知识的快速工作流构建器,支持多模态交互和高度可定制的扩展,使用直观