强大的Rust库和CLI工具,统一管理多种LLM和语音后端(OpenAI、Claude、Gemini、Ollama、ElevenLabs等),简化复杂AI工作流。

支持多步链式操作,无缝衔接不同后端;提供语音转文本、视觉和推理功能;可扩展性强,轻松添加新后端

LLM | #工具
为学术研究提供强大的PDF阅读与标注工具。

支持六种颜色高亮标注,满足多样化标注需求;可导入导出JSON格式标注,防止数据丢失;保留原Google Scholar PDF Reader全部功能,如引用预览、AI大纲辅助阅读等

Scholar PDF Reader with Annotations | #工具
Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署。

采用vLLM优化的推理调度器,提升性能;支持解耦式服务,灵活部署;提供独立和共享两种KV缓存方案,优化资源利用

llm-d | #框架
MoviiGen 1.1:打造电影级画质的视频生成模型,让视频创作更专业、更高效。

超越竞品的电影美学表现,尤其在氛围营造、镜头运动和细节保留上表现卓越;清晰度提升14.6%,真实感增强4.3%,适合高保真场景;支持720P和1080P分辨率,保持高质量输出
Dimple:首个离散扩散多模态大语言模型,为多模态任务提供强大的语言生成能力。

混合训练范式,结合自回归和扩散训练,性能提升3.9%;支持多种解码方式,包括自信解码、随机解码和掩码解码;可控生成,通过结构先验实现对格式、结构和长度的精细控制
为复杂终端任务设计的LLM基准测试工具。

提供约50个真实终端任务,覆盖从代码编译到模型训练的全场景;搭载沙盒环境,安全运行各类任务;支持多种语言模型,助力Agent性能评估

Terminal-Bench | #工具
为安全专业人士和爱好者打造的高效Web应用审计工具。

每月至少发布一次新版本,持续更新;提供详细的Roadmap,让用户提前了解新功能;拥有77个Forks,社区活跃度高

Caido | #工具
Mystical_ps:将编程语言变成魔法符咒的奇妙项目。

将PostScript代码转化为视觉化的魔法圈,让代码更直观;提供丰富的符号系统,支持自定义符号;代码布局优化,避免视觉冲突,提升可读性
Crawl4AI RAG MCP Server:为AI Agent和AI Coding Assistant提供强大的网络爬虫和RAG能力的MCP 服务器的实现。

支持智能URL检测,自动处理多种URL类型;递归爬取网站内容,支持并行处理,效率大幅提升;集成Supabase和OpenAI,实现精准语义搜索和知识检索
PKU-DAIR/Starter-Guide:为数据管理和人工智能领域的新人提供全面的开源文档和技术指南。

汇集了团队的核心论文和经验分享,帮助初学者快速搭建技术基础;涵盖AI系统、AutoML、数据库、AI Agent等多个热门研究方向;提供科研入门指南,助力新人快速上手
Back to Top