黑洞资源笔记

15:39 · Mar 19, 2025 · Wed

Awesome-Long-Chain-of-Thought-Reasoning：为大语言模型的长思维链推理能力提升提供全面的资源和研究综述。

涵盖600+篇长链推理相关文献，资源丰富；提出深度推理、可行反思和广泛探索三大核心特性；首个系统性总结长链推理的综述，填补研究空白

15:38 · Mar 19, 2025 · Wed

AI驱动的YouTube内容探索工具，让你秒变YouTube搜索达人。

用自然语言搜索视频内容，秒出精准结果；聊天式交互，与频道内容“对话”；快速定位视频关键片段，效率提升N倍

YT Navigator | #工具

工具

15:33 · Mar 19, 2025 · Wed

building-llm-applications-from-scratch：关于如何从头构建基于大型语言模型（LLM）应用程序的课程，涵盖了 Transformer 架构、检索增强生成（RAG）技术以及开源 LLM 部署的深入知识。

深入讲解Transformer架构与RAG技术，提供6个实战项目，学以致用

15:30 · Mar 19, 2025 · Wed

SuperBPE: Space Travel for Language Models：本文创新性地提出了 SuperBPE 超词词元化算法，通过两阶段预词元化课程，突破了传统 BPE 子词词元化的限制，实现了更高效的文本编码和更优越的语言模型性能，尤其在推理效率方面取得了显著提升，挑战了子词词元化的传统范式，为未来语言模型词元化技术的发展开辟了新的方向。

15:25 · Mar 19, 2025 · Wed

迄今为止最大的自动驾驶数据集，助力开发者轻松训练自动驾驶模型。

数据量惊人，高达90 TeraBytes；超长驾驶时长，涵盖5000小时真实路况；6个环绕高清摄像头，全方位捕捉驾驶场景

L2D | #数据集

数据集

15:24 · Mar 19, 2025 · Wed

一个社区驱动的AI自动化框架，结合语言模型与专业工具，轻松完成复杂的自动化任务。

集成开源模型如Qwen，支持多层级LLM系统；提供Web搜索、爬虫和Python代码执行等强大功能；支持Docker部署，方便快捷

LangManus | #框架

框架

15:21 · Mar 19, 2025 · Wed

Real Time Speech Transcription with FastRTC：实时语音转录，让语音秒变文字。

本地运行，无需联网，保护隐私；支持多种语言，满足多语种需求；高效实时，低延迟转录，流畅体验

15:19 · Mar 19, 2025 · Wed

Step-Video-TI2V：一款强大的文本驱动图像转视频生成模型。它能将静态图像变成生动的视频，解决图像到视频生成的难题。

30B参数，生成高质量视频；支持多种运镜方式，如镜头环绕、推进、拉远等；提供动态控制，可调节视频动作强度

15:16 · Mar 19, 2025 · Wed

Docling：让文档为生成式AI做好准备。它能解决文档处理和解析的难题，将多种格式的文档转换为AI可直接使用的数据。

支持多种文档格式，包括PDF、DOCX、XLSX等；提供先进的PDF理解能力，包括页面布局、表格结构等；本地执行支持，确保数据安全

14:37 · Mar 19, 2025 · Wed

15:18 · Mar 17, 2025 · Mon

TinyKVM：为高性能沙箱环境提供原生性能的虚拟机监视器。

基于KVM，仅使用其一小部分API，实现极简设计；支持内存限制和执行超时，防止程序失控；可将初始化程序分叉为数百个预初始化的虚拟机，大幅提升效率