黑洞资源笔记
15:42 · Mar 19, 2025 · Wed
MovieAgent
:通过多Agent协同规划实现自动化电影生成的创新项目。
首次探索自动化长视频生成范式,从剧本到成片一键生成;采用多Agent协同推理,模拟导演、编剧、分镜师等角色,效率大幅提升;支持多种生成模型,如ROICtrl和HunyuanVideo_I2V,生成效果稳定且多样
15:40 · Mar 19, 2025 · Wed
TxAgent
:为精准医疗提供强大的AI治疗推理工具 |
#工具
跨211种工具进行多步推理,精准分析药物相互作用;在3168个药物推理任务中达到92.1%的准确率,超越GPT-4o;支持个性化治疗方案,综合患者年龄、基因和疾病进展
工具
15:39 · Mar 19, 2025 · Wed
Awesome-Long-Chain-of-Thought-Reasoning
:为大语言模型的长思维链推理能力提升提供全面的资源和研究综述。
涵盖600+篇长链推理相关文献,资源丰富;提出深度推理、可行反思和广泛探索三大核心特性;首个系统性总结长链推理的综述,填补研究空白
15:38 · Mar 19, 2025 · Wed
AI驱动的YouTube内容探索工具,让你秒变YouTube搜索达人。
用自然语言搜索视频内容,秒出精准结果;聊天式交互,与频道内容“对话”;快速定位视频关键片段,效率提升N倍
YT Navigator
|
#工具
工具
15:33 · Mar 19, 2025 · Wed
building-llm-applications-from-scratch
:关于如何从头构建基于大型语言模型(LLM)应用程序的课程,涵盖了 Transformer 架构、检索增强生成(RAG)技术以及开源 LLM 部署的深入知识。
深入讲解Transformer架构与RAG技术,提供6个实战项目,学以致用
15:30 · Mar 19, 2025 · Wed
SuperBPE: Space Travel for Language Models
:本文创新性地提出了 SuperBPE 超词词元化算法,通过两阶段预词元化课程,突破了传统 BPE 子词词元化的限制,实现了更高效的文本编码和更优越的语言模型性能,尤其在推理效率方面取得了显著提升,挑战了子词词元化的传统范式,为未来语言模型词元化技术的发展开辟了新的方向。
15:25 · Mar 19, 2025 · Wed
迄今为止最大的自动驾驶数据集,助力开发者轻松训练自动驾驶模型。
数据量惊人,高达90 TeraBytes;超长驾驶时长,涵盖5000小时真实路况;6个环绕高清摄像头,全方位捕捉驾驶场景
L2D
|
#数据集
数据集
15:24 · Mar 19, 2025 · Wed
一个社区驱动的AI自动化框架,结合语言模型与专业工具,轻松完成复杂的自动化任务。
集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;支持Docker部署,方便快捷
LangManus
|
#框架
框架
15:21 · Mar 19, 2025 · Wed
Real Time Speech Transcription with FastRTC
:实时语音转录,让语音秒变文字。
本地运行,无需联网,保护隐私;支持多种语言,满足多语种需求;高效实时,低延迟转录,流畅体验
15:19 · Mar 19, 2025 · Wed
Step-Video-TI2V
:一款强大的文本驱动图像转视频生成模型。它能将静态图像变成生动的视频,解决图像到视频生成的难题。
30B参数,生成高质量视频;支持多种运镜方式,如镜头环绕、推进、拉远等;提供动态控制,可调节视频动作强度
15:16 · Mar 19, 2025 · Wed
Docling
:让文档为生成式AI做好准备。它能解决文档处理和解析的难题,将多种格式的文档转换为AI可直接使用的数据。
支持多种文档格式,包括PDF、DOCX、XLSX等;提供先进的PDF理解能力,包括页面布局、表格结构等;本地执行支持,确保数据安全
Before
After
Home
Powered by
BroadcastChannel
&
Sepia