Awesome-Long-Chain-of-Thought-Reasoning:为大语言模型的长思维链推理能力提升提供全面的资源和研究综述。

涵盖600+篇长链推理相关文献,资源丰富;提出深度推理、可行反思和广泛探索三大核心特性;首个系统性总结长链推理的综述,填补研究空白
AI驱动的YouTube内容探索工具,让你秒变YouTube搜索达人。

用自然语言搜索视频内容,秒出精准结果;聊天式交互,与频道内容“对话”;快速定位视频关键片段,效率提升N倍

YT Navigator | #工具
building-llm-applications-from-scratch:关于如何从头构建基于大型语言模型(LLM)应用程序的课程,涵盖了 Transformer 架构、检索增强生成(RAG)技术以及开源 LLM 部署的深入知识。

深入讲解Transformer架构与RAG技术,提供6个实战项目,学以致用
SuperBPE: Space Travel for Language Models:本文创新性地提出了 SuperBPE 超词词元化算法,通过两阶段预词元化课程,突破了传统 BPE 子词词元化的限制,实现了更高效的文本编码和更优越的语言模型性能,尤其在推理效率方面取得了显著提升,挑战了子词词元化的传统范式,为未来语言模型词元化技术的发展开辟了新的方向。
迄今为止最大的自动驾驶数据集,助力开发者轻松训练自动驾驶模型。

数据量惊人,高达90 TeraBytes;超长驾驶时长,涵盖5000小时真实路况;6个环绕高清摄像头,全方位捕捉驾驶场景

L2D | #数据集
一个社区驱动的AI自动化框架,结合语言模型与专业工具,轻松完成复杂的自动化任务。

集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;支持Docker部署,方便快捷

LangManus | #框架
Real Time Speech Transcription with FastRTC:实时语音转录,让语音秒变文字。

本地运行,无需联网,保护隐私;支持多种语言,满足多语种需求;高效实时,低延迟转录,流畅体验
Step-Video-TI2V:一款强大的文本驱动图像转视频生成模型。它能将静态图像变成生动的视频,解决图像到视频生成的难题。

30B参数,生成高质量视频;支持多种运镜方式,如镜头环绕、推进、拉远等;提供动态控制,可调节视频动作强度
Docling:让文档为生成式AI做好准备。它能解决文档处理和解析的难题,将多种格式的文档转换为AI可直接使用的数据。

支持多种文档格式,包括PDF、DOCX、XLSX等;提供先进的PDF理解能力,包括页面布局、表格结构等;本地执行支持,确保数据安全
TinyKVM:为高性能沙箱环境提供原生性能的虚拟机监视器。

基于KVM,仅使用其一小部分API,实现极简设计;支持内存限制和执行超时,防止程序失控;可将初始化程序分叉为数百个预初始化的虚拟机,大幅提升效率
Back to Top