building-llm-applications-from-scratch:关于如何从头构建基于大型语言模型(LLM)应用程序的课程,涵盖了 Transformer 架构、检索增强生成(RAG)技术以及开源 LLM 部署的深入知识。

深入讲解Transformer架构与RAG技术,提供6个实战项目,学以致用
SuperBPE: Space Travel for Language Models:本文创新性地提出了 SuperBPE 超词词元化算法,通过两阶段预词元化课程,突破了传统 BPE 子词词元化的限制,实现了更高效的文本编码和更优越的语言模型性能,尤其在推理效率方面取得了显著提升,挑战了子词词元化的传统范式,为未来语言模型词元化技术的发展开辟了新的方向。
迄今为止最大的自动驾驶数据集,助力开发者轻松训练自动驾驶模型。

数据量惊人,高达90 TeraBytes;超长驾驶时长,涵盖5000小时真实路况;6个环绕高清摄像头,全方位捕捉驾驶场景

L2D | #数据集
一个社区驱动的AI自动化框架,结合语言模型与专业工具,轻松完成复杂的自动化任务。

集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;支持Docker部署,方便快捷

LangManus | #框架
Real Time Speech Transcription with FastRTC:实时语音转录,让语音秒变文字。

本地运行,无需联网,保护隐私;支持多种语言,满足多语种需求;高效实时,低延迟转录,流畅体验
Step-Video-TI2V:一款强大的文本驱动图像转视频生成模型。它能将静态图像变成生动的视频,解决图像到视频生成的难题。

30B参数,生成高质量视频;支持多种运镜方式,如镜头环绕、推进、拉远等;提供动态控制,可调节视频动作强度
Docling:让文档为生成式AI做好准备。它能解决文档处理和解析的难题,将多种格式的文档转换为AI可直接使用的数据。

支持多种文档格式,包括PDF、DOCX、XLSX等;提供先进的PDF理解能力,包括页面布局、表格结构等;本地执行支持,确保数据安全
TinyKVM:为高性能沙箱环境提供原生性能的虚拟机监视器。

基于KVM,仅使用其一小部分API,实现极简设计;支持内存限制和执行超时,防止程序失控;可将初始化程序分叉为数百个预初始化的虚拟机,大幅提升效率
HaploVLM:腾讯推出的单Transformer架构多模态理解基础模型,为文本、图像和视频输入提供全面的跨模态理解能力。

统一架构,支持多模态输入和自回归响应生成;高效训练,优化训练配方,降低资源消耗;支持Ascend NPU和GPU环境,灵活适配多种硬件
Claude Code MCP:让Claude通过MCP工具获得强大的扩展能力。它能解决AI模型与外部工具交互的难题,核心价值在于提升模型的功能性和灵活性。

集成多种MCP服务器,如Web搜索、GitHub操作、文件系统管理等;支持本地和远程服务器的灵活配置;提供详细的开发指南和规范,助力开发者快速上手
一个灵活的Python库和CLI工具,用于通过自然语言与MCP服务器交互,支持多种LLM模型。

支持OpenAI、Anthropic和Ollama等多模型;自动发现并使用MCP服
务器提供的工具;提供清晰的API和命令行界面,易于集成和使用

Dolphin MCP | #工具
用自然语言控制Blender的工具,让3D建模变得轻而易举。

通过简单描述直接创建和修改3D模型;实时反馈,快速迭代设计;支持多种MCP客户端,无缝集成到现有工作流

Blender MCP VXAI | #工具
Back to Top