高效、可扩展的强化学习训练框架,用于训练具有推理和搜索引擎调用能力的大型语言模型(LLM)。

基于veRL构建,支持3B规模的基础LLM;通过规则化奖励机制,让LLM自主学会推理和搜索;提供完整的训练流程和工具支持,助力研究和开发

Search-R1 | #框架
Ryan Hart 的LLM学习法:用 AI 助手 Grok 作为个人导师,实现超快速学习。| #经验

提供 8 种学习提示,涵盖从技能特定学习到资源整理的全方位方法;强调个性化学习计划,帮助用户高效掌握任何技能;结合实际案例和加速学习技巧,让学习事半功倍
一个强大的提示词优化工具,帮助你一键提升AI回复的准确度。

支持多轮智能优化,显著提升AI回答质量;集成OpenAI、Gemini等主流AI模型,满足多样化需求;纯客户端处理,数据安全无忧

Prompt Optimizer | #工具
一款辅助轻松阅读论文的开源工具 | arXiv-txt.org | #工具

只需将论文链接中的 "arxiv.org" 替换为 "arxiv-txt.org",即可获得一份摘要以及论文 PDF 文件内容。支持快速部署到 Vercel,并提供完整 API 接口使用
Back to Top