黑洞资源笔记

14:52 · Dec 5, 2024 · Thu

一个用C语言编写的自举C编译器，能够编译自身代码。输出x86-64汇编代码，虽然未经优化但适合教学用途。

特色是实现了三重编译：先用gcc编译得到初始编译器，再用它编译自身得到第二个版本，最后用第二版本再次编译得到最终版本，实现完全的自举过程。

30cc | #编译器

编译器
14:51 · Dec 5, 2024 · Thu

LLMs-in-Finance：一个关于金融领域大语言模型应用的知识库，涵盖生成式AI、智能代理、RAG检索增强等技术在金融领域的实践。包含了各类金融场景下的LLM应用案例、论文资料、数据集以及多模态金融分析等内容，适合研究金融科技与AI结合的开发者参考
14:48 · Dec 5, 2024 · Thu

一份全面的Solar模型提示工程指南，提供了系统化的教程从基础到高级的提示技巧。包含11个章节，涵盖基本结构、直接清晰提示、少样本学习、角色风格、结构化提示、推理链等关键技术，并附带实际案例和优化方法。特别适合想要掌握LLM提示工程的非专业用户。

Solar Prompt Guide |#指南

指南
14:46 · Dec 5, 2024 · Thu

DailyPaper：一个专业的AI论文日报项目，由M-A-P团队维护，每日精选并深度点评arXiv上的最新人工智能相关论文，内容涵盖大语言模型、计算机视觉、多模态等前沿领域，提供专业且富有洞察力的技术评述
14:44 · Dec 5, 2024 · Thu

一个简洁的Rust命令行工具开发框架，基于clap库封装，通过简单的函数注解方式即可快速构建CLI应用，大幅减少样板代码。灵感来源于Python的typer库，支持命令和子命令的灵活定义

Terse CLI | #框架

框架
14:38 · Dec 5, 2024 · Thu

2025考证时间表
11:21 · Dec 4, 2024 · Wed

琼瑶去世……
01:47 · Dec 3, 2024 · Tue

CodeTree: 基于 Agent 引导的树状搜索方法优化 LLM 代码生成

「来自 Salesforce AI 研究院的论文，提出了 CodeTree 代码生成框架，通过构建树状搜索结构并配合四个专门的 AI Agent (思考者、解决者、调试者、评判者) 协同工作，显著提升了 LLM 在代码生成任务中的表现，尤其在处理复杂编程问题时更具优势」

论文主要创新点在于:

1. 采用树状结构进行代码生成探索:
- 树的根节点是问题描述
- 每个子节点代表一个可能的代码解决方案
- 通过广度优先或深度优先搜索来探索不同的解决方案

2. 引入了四个专门的 AI Agent:
- Thinker(思考者): 负责生成解决问题的高层策略
- Solver(解决者): 根据策略实现具体代码
- Debugger(调试者): 根据反馈改进代码
- Critic(评判者): 评估代码质量, 引导搜索方向

主要优势:

性能出色:
- 在 HumanEval 达到 95.1% 的准确率
- 在 MBPP 达到 98.7% 的准确率
- 在竞赛级别的 CodeContests 达到 43.0% 的准确率

搜索效率高:
- 即使在较小的生成预算(少于9个样本)下也能达到不错的性能
- 通过 Critic 代理的引导避免了无效的搜索路径

灵活性强:
- 可以动态决定探索的策略数量
- 能够根据问题难度调整搜索深度和广度
01:36 · Dec 3, 2024 · Tue
01:20 · Dec 3, 2024 · Tue

Hands-On Large Language Models：该存储库包含《动手大型语言模型》一书中的完整代码示例。包括笔记本示例，涵盖从语言模型介绍到微调的所有内容。
01:15 · Dec 3, 2024 · Tue

Dozzle 实时查看Docker container 当中的 logs，Web 界面友好，搜索功能强大，还有比较多的高级功能
01:11 · Dec 3, 2024 · Tue

系统设计四个支柱
14:58 · Nov 30, 2024 · Sat

问卷调研平台：xiaoju-survey

这是一款免费且专业的调研系统，旨在为个人和企业提供一站式产品级的调研解决方案。它前后端均已开源，并支持 Docker 一键部署，内置了多种题型和模版，支持逻辑编排、自定义品牌、权限管理、数据分析和导出等功能，可用于创建问卷、考试、测评和复杂表单。
14:53 · Nov 30, 2024 · Sat

LLMs Interview Questions：收录了63个大语言模型(LLM)相关的面试问题及答案，针对2024年机器学习和数据科学面试提供系统化的准备资料。内容涵盖LLMs基本原理、Transformer架构、注意力机制、预训练与微调等核心知识点，附带详细解答和代码示例