黑洞资源笔记

15:33 · Mar 19, 2025 · Wed

building-llm-applications-from-scratch：关于如何从头构建基于大型语言模型（LLM）应用程序的课程，涵盖了 Transformer 架构、检索增强生成（RAG）技术以及开源 LLM 部署的深入知识。

深入讲解Transformer架构与RAG技术，提供6个实战项目，学以致用

15:30 · Mar 19, 2025 · Wed

SuperBPE: Space Travel for Language Models：本文创新性地提出了 SuperBPE 超词词元化算法，通过两阶段预词元化课程，突破了传统 BPE 子词词元化的限制，实现了更高效的文本编码和更优越的语言模型性能，尤其在推理效率方面取得了显著提升，挑战了子词词元化的传统范式，为未来语言模型词元化技术的发展开辟了新的方向。

15:25 · Mar 19, 2025 · Wed

迄今为止最大的自动驾驶数据集，助力开发者轻松训练自动驾驶模型。

数据量惊人，高达90 TeraBytes；超长驾驶时长，涵盖5000小时真实路况；6个环绕高清摄像头，全方位捕捉驾驶场景

L2D | #数据集

数据集

15:24 · Mar 19, 2025 · Wed

一个社区驱动的AI自动化框架，结合语言模型与专业工具，轻松完成复杂的自动化任务。

集成开源模型如Qwen，支持多层级LLM系统；提供Web搜索、爬虫和Python代码执行等强大功能；支持Docker部署，方便快捷

LangManus | #框架

框架

15:21 · Mar 19, 2025 · Wed

Real Time Speech Transcription with FastRTC：实时语音转录，让语音秒变文字。

本地运行，无需联网，保护隐私；支持多种语言，满足多语种需求；高效实时，低延迟转录，流畅体验

15:19 · Mar 19, 2025 · Wed

Step-Video-TI2V：一款强大的文本驱动图像转视频生成模型。它能将静态图像变成生动的视频，解决图像到视频生成的难题。

30B参数，生成高质量视频；支持多种运镜方式，如镜头环绕、推进、拉远等；提供动态控制，可调节视频动作强度

15:16 · Mar 19, 2025 · Wed

Docling：让文档为生成式AI做好准备。它能解决文档处理和解析的难题，将多种格式的文档转换为AI可直接使用的数据。

支持多种文档格式，包括PDF、DOCX、XLSX等；提供先进的PDF理解能力，包括页面布局、表格结构等；本地执行支持，确保数据安全

14:37 · Mar 19, 2025 · Wed

15:18 · Mar 17, 2025 · Mon

TinyKVM：为高性能沙箱环境提供原生性能的虚拟机监视器。

基于KVM，仅使用其一小部分API，实现极简设计；支持内存限制和执行超时，防止程序失控；可将初始化程序分叉为数百个预初始化的虚拟机，大幅提升效率

15:17 · Mar 17, 2025 · Mon

HaploVLM：腾讯推出的单Transformer架构多模态理解基础模型，为文本、图像和视频输入提供全面的跨模态理解能力。

统一架构，支持多模态输入和自回归响应生成；高效训练，优化训练配方，降低资源消耗；支持Ascend NPU和GPU环境，灵活适配多种硬件

15:16 · Mar 17, 2025 · Mon

Claude Code MCP：让Claude通过MCP工具获得强大的扩展能力。它能解决AI模型与外部工具交互的难题，核心价值在于提升模型的功能性和灵活性。

集成多种MCP服务器，如Web搜索、GitHub操作、文件系统管理等；支持本地和远程服务器的灵活配置；提供详细的开发指南和规范，助力开发者快速上手

15:14 · Mar 17, 2025 · Mon

一个灵活的Python库和CLI工具，用于通过自然语言与MCP服务器交互，支持多种LLM模型。

支持OpenAI、Anthropic和Ollama等多模型；自动发现并使用MCP服
务器提供的工具；提供清晰的API和命令行界面，易于集成和使用

Dolphin MCP | #工具

工具

15:12 · Mar 17, 2025 · Mon

用自然语言控制Blender的工具，让3D建模变得轻而易举。

通过简单描述直接创建和修改3D模型；实时反馈，快速迭代设计；支持多种MCP客户端，无缝集成到现有工作流

Blender MCP VXAI | #工具

工具