黑洞资源笔记

为你的数据量身定制的大型语言模型基准测试框架

动态生成零样本基准，实时更新知识需求；支持多种数据格式（PDF、Word、HTML等），适应多样化场景；强大的可扩展性，轻松集成自定义模型或领域约束

YourBench | #框架

沉浸式故事书视频生成的多Agent框架。

高质量故事创作，基于输入的故事设定生成精彩故事；多模态内容生成，涵盖图像、语音、音效和音乐；可定制工作流，用户可定义专家工具提升生成质量

MM_StoryAgent | #框架

smartfunc：将文档字符串转化为LLM函数的Python库。

简单易用，只需在函数上添加装饰器即可；支持异步操作，可实现微批处理；集成Pydantic模型，方便定义返回值结构

让语言模型具备主动搜索能力的强化学习框架。

通过多轮交互提升模型对长尾和知识密集型任务的性能；支持自定义搜索工具，灵活适配不同需求；采用veRL框架，训练效率更高

Multimodal-Search-R1 | #框架

Open WebUI Artifacts Overhaul：一个用户友好的AI界面，支持Ollama、OpenAI API等多种AI工具。

编码画布功能，代码输出直观展示，方便开发者快速查看和编辑；支持30多种编程语言，满足多样化需求；提供设计视图和代码视图切换，增强用户体验

AI味去除：让AI生成的文本摆脱机械感，重获人类写作风格。

扩充文字，1000字扩至2000字，AI味仅提升22%；重写文字，5000字重写后AI味可从70%降至17%；提供详细的优化策略和示例，助力文本更自然流畅

DeepResearcher：通过强化学习在真实世界环境中训练LLM基础的深度研究Agent，让研究更智能、更高效。

实现高达28.9分的性能提升，远超传统方法；独特的端到端训练，让Agent具备规划、验证、反思等认知行为；支持真实网络搜索交互，让研究更贴近实际应用场景