为你的数据量身定制的大型语言模型基准测试框架

动态生成零样本基准,实时更新知识需求;支持多种数据格式(PDF、Word、HTML等),适应多样化场景;强大的可扩展性,轻松集成自定义模型或领域约束

YourBench | #框架
沉浸式故事书视频生成的多Agent框架。

高质量故事创作,基于输入的故事设定生成精彩故事;多模态内容生成,涵盖图像、语音、音效和音乐;可定制工作流,用户可定义专家工具提升生成质量

MM_StoryAgent | #框架
smartfunc:将文档字符串转化为LLM函数的Python库。

简单易用,只需在函数上添加装饰器即可;支持异步操作,可实现微批处理;集成Pydantic模型,方便定义返回值结构
让语言模型具备主动搜索能力的强化学习框架。

通过多轮交互提升模型对长尾和知识密集型任务的性能;支持自定义搜索工具,灵活适配不同需求;采用veRL框架,训练效率更高

Multimodal-Search-R1 | #框架
Open WebUI Artifacts Overhaul:一个用户友好的AI界面,支持Ollama、OpenAI API等多种AI工具。

编码画布功能,代码输出直观展示,方便开发者快速查看和编辑;支持30多种编程语言,满足多样化需求;提供设计视图和代码视图切换,增强用户体验
AI味去除:让AI生成的文本摆脱机械感,重获人类写作风格。

扩充文字,1000字扩至2000字,AI味仅提升22%;重写文字,5000字重写后AI味可从70%降至17%;提供详细的优化策略和示例,助力文本更自然流畅
DeepResearcher:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。

实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
Back to Top