黑洞资源笔记
-
-
-
- DailyPaper:一个专业的AI论文日报项目,由M-A-P团队维护,每日精选并深度点评arXiv上的最新人工智能相关论文,内容涵盖大语言模型、计算机视觉、多模态等前沿领域,提供专业且富有洞察力的技术评述
-
- 2025考证时间表
- 琼瑶去世……
- CodeTree: 基于 Agent 引导的树状搜索方法优化 LLM 代码生成
「来自 Salesforce AI 研究院的论文,提出了 CodeTree 代码生成框架,通过构建树状搜索结构并配合四个专门的 AI Agent (思考者、解决者、调试者、评判者) 协同工作,显著提升了 LLM 在代码生成任务中的表现,尤其在处理复杂编程问题时更具优势」
论文主要创新点在于:
1. 采用树状结构进行代码生成探索:
- 树的根节点是问题描述
- 每个子节点代表一个可能的代码解决方案
- 通过广度优先或深度优先搜索来探索不同的解决方案
2. 引入了四个专门的 AI Agent:
- Thinker(思考者): 负责生成解决问题的高层策略
- Solver(解决者): 根据策略实现具体代码
- Debugger(调试者): 根据反馈改进代码
- Critic(评判者): 评估代码质量, 引导搜索方向
主要优势:
性能出色:
- 在 HumanEval 达到 95.1% 的准确率
- 在 MBPP 达到 98.7% 的准确率
- 在竞赛级别的 CodeContests 达到 43.0% 的准确率
搜索效率高:
- 即使在较小的生成预算(少于9个样本)下也能达到不错的性能
- 通过 Critic 代理的引导避免了无效的搜索路径
灵活性强:
- 可以动态决定探索的策略数量
- 能够根据问题难度调整搜索深度和广度 -
- Hands-On Large Language Models:该存储库包含《动手大型语言模型》一书中的完整代码示例。包括笔记本示例,涵盖从语言模型介绍到微调的所有内容。
- Dozzle 实时查看Docker container 当中的 logs,Web 界面友好,搜索功能强大,还有比较多的高级功能
- 系统设计四个支柱
-
- LLMs Interview Questions:收录了63个大语言模型(LLM)相关的面试问题及答案,针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点,附带详细解答和代码示例