Skip to main content

黑洞资源笔记

  1. OpenMythos:从第一性原理,还原 Claude Mythos 的 “思考” 本质

    这不仅是一个代码库,更是一场关于大模型“思考”本质的深度实验。Kye Gomez 推出的 OpenMythos,试图从第一性原理出发,还原那个让业界惊叹的 Claude Mythos 背后可能的运行逻辑。

    核心观点与架构深度解析

    1. 循环深度Transformer (RDT):隐式思维的源头
    OpenMythos 的核心假设是:Mythos 并非无限堆叠层数,而是一个循环深度Transformer。
    - 逻辑:它在单个前向传播中,将一组固定的权重重复调用 T 次(最高可达 16 次)。
    - 这意味着推理发生在连续的潜空间(Latent Space)中,而不是通过显式的 Token 输出。这是一种“沉默的思考”,在逻辑深度上等同于思维链(CoT),但效率更高。

    2. 混合专家模型 (MoE) 的进化:深度与广度的平衡
    在循环块内部,FFN 层被替换为类似 DeepSeekMoE 的精细化 MoE 设计。
    - 动态路由:最关键的创新在于,路由器的选择在每一次循环中都是不同的。
    - 这意味着每一轮循环并不是简单的重复,而是针对不同领域知识的连续精炼。MoE 提供了知识的广度,而循环提供了推理的深度。

    3. 架构三部曲:前奏、循环与尾声
    - Prelude(前奏):标准 Transformer 层,负责初始编码。
    - Recurrent Block(循环块):计算核心,通过 LTI(线性时不变)稳定规则进行输入注入,确保隐状态在多次循环中不漂移。
    - Coda(尾声):标准 Transformer 层,负责最终输出解码。

    4. 效率的降维打击
    - 参数复用:一个 k 层的模型运行 L 次循环,可以达到 k 乘以 L 层标准模型的质量。
    - 性能飞跃:在 770M 参数规模下,RDT 的表现足以匹配 1.3B 的标准模型。
    - 见解:这重塑了缩放定律(Scaling Laws)的讨论——未来的竞争力可能不再是训练时的参数量,而是推理时的循环深度。

    技术稳定性与优化

    为了解决循环模型常见的训练不稳定问题,OpenMythos 引入了三项关键机制:
    - LTI 约束注入:通过数学构造确保谱半径小于 1,从根本上防止残差爆炸。
    - 适应性计算时间 (ACT):允许模型根据任务难度自动决定何时停止循环。
    - 深度 LoRA 适配器:在保持权重共享的同时,让每一轮循环拥有微小的行为差异化。

    传统的 Transformer 在处理从未见过的逻辑组合时往往会失效,而循环架构展现出了“系统性泛化”的能力。它更像人类的大脑:面对简单问题快速反应,面对复杂问题则在脑中反复盘旋、多次迭代,最终得出一个深思熟虑的答案。

    OpenMythos 证明了:推理深度是推理时间计算量(Inference-time Compute)的函数,而不仅仅是存储参数的堆砌。

    项目资源:代码仓库 | 社区讨论

    参考文献与延伸阅读

    - 循环深度Transformer中的隐式推理
    - Parcae 稳定循环语言模型缩放定律
    - 潜空间中的推理能力研究
    - DeepSeekMoE 专家专业化研究
  2. AI 代理操作浏览器时,经常卡在复杂交互上:需要精确的元素选择器、处理弹窗、应对页面变化,还要编写一堆工具函数,调试起来异常繁琐。

    Browser Harness 将 LLM 浏览器自动化所需的全部能力整合到一起,提供了一套自愈式浏览器控制解决方案。

    直接基于 CDP(Chrome DevTools Protocol)构建,支持代理实时编写缺失工具、中途自愈修复、无框架限制的自由操作。

    主要功能:

    - 自愈式浏览器控制,代理可中途编辑 helpers.py 添加缺失功能(如文件上传);
    - 纯 CDP WebSocket 直连 Chrome,无中间层干扰,~592 行 Python 核心代码;
    - 预载工具函数(helpers.py),支持屏幕激活、交互演示和远程浏览器;
    - 领域技能系统(domain-skills),自动学习并保存 GitHub、LinkedIn、Amazon 等站点操作;
    - 免费远程浏览器服务,3 个并发实例,支持部署子代理;
    - 一键运行(run.py),安装后即可连接真实浏览器执行任意任务。

    支持本地 Chrome + Python 环境,通过 install.md 快速部署,适合 AI 开发者、自动化工程师使用。
  3. 金融分析常常需要同时打开多个软件,数据源工具抓取行情,Excel建模计算,TradingView画K线图,聊天工具交流观点,来回切换效率低下。

    Fincept Terminal 将金融分析所需功能完美整合,提供专业级投资研究解决方案。

    不仅有CFA级量化分析、37个AI智能代理(巴菲特、芒格等策略框架),还支持100+数据源实时连接、16家券商交易集成、节点编辑器自动化工作流。

    主要功能:

    - CFA级分析工具,支持DCF估值、投资组合优化、风险度量(VaR、Sharpe比率)、衍生品定价;
    - 37个AI代理,覆盖交易/投资、经济、地缘政治,本地LLM多模型支持;
    - 100+数据连接器,Yahoo Finance、FRED、Kraken、Polygon等实时行情;
    - 实时交易支持,16家券商集成(IBKR、Alpaca等),算法交易/模拟交易;
    - QuantLib量化套件,18个模块包括定价、风险、波动率分析;
    - 节点编辑器可视化工作流,AI量化实验室支持机器学习/HFT策略。

    纯C++20/Qt6原生桌面应用,支持Windows、Linux、macOS,一键安装运行,适合投资者、交易员、量化研究者。
  4. 🔥 高质量住宅代理IP(稳定 / 干净 / 低风控)#AD

    原生ISP住宅IP
    稳定在线,成功率高
    低风控,适合长期使用
    亿级动态IP池,不限并发,不限带宽,可测试
    覆盖全球

    💰 专属优惠:
    使用折扣码 bestcode90 → 立享9折
    🌐 官网直达(专属优惠入口):
    https://www.swiftproxy.net/?code=YMMP0CWGM
  5. 有道在 LobsterAI 之后推出了 Agent 体系下的最新产品——有道宝库,定位为 AI 研究助手与思考伙伴,辅助深度思考与知识内化。试用了一下,从技术实现看有几个值得关注的点:

    核心架构:
    • RAG + 强制溯源
    所有回答严格基于用户上传文档,每条回答附带原文引用,可跳转到源文件具体段落,从架构层面降低幻觉问题。
    • 多源数据支持
    最多支持 50 个源文件上传,支持导入公众号/小红书/B站/微博/小宇宙/知乎等国内平台的深度内容,无缝衔接中国用户的知识获取习惯。
    • 多文档融合技术
    动态上下文调度:自动识别核心文档与补充材料,跨文档去重,按主题重组输出结构。
    • 中文 NLP 专项优化
    自研文档解析引擎处理中文 PDF/扫描件/复杂排版;自研中文渲染引擎针对汉字笔画结构单独建模,视觉生成层引入字形完整性校验,解决笔画缺失/乱码问题。
    • 流式生成架构
    通过模板预热、端侧渲染等技术手段,将 PPT 生成时间压缩到约 5 分钟;播客支持单人/双人模式,双人模式自动生成对话结构(提问-回应-追问)。
    • 可编辑输出
    所有生成内容(PPT/脑图/图文文章等文本格式)均支持二次编辑。
    • CLI 化进展
    正在开发命令行工具,支持 AI Agent(LobsterAI)直接调用,实现从“人用工具”到“Agent 可调用能力模块”的演进。

    技术细节:
    部署方式:本地部署,即开即用,这点很方便
    生态集成:与有道翻译/词典数据管道打通,一键导入资料
    网页版: baoku.youdao.com
    客户端:词典 v11.3.2(Mac/Windows)
  6. Vibe Coding 盛行,如何用工具守护代码库健康? | 帖子

    提要:随着 Vibe Coding(氛围感编程)的流行,开发者正通过 AI 极速生成代码,但这同时也带来了大量无用的死代码。通过结合 Ruff、Vulture 或 Knip 等静态分析工具,可以在开发循环中自动识别并清理这些冗余,维持代码库的健康度。

    现在的编程节奏变了,大家越来越依赖 AI 快速出原型。这种“氛围感编程”很爽,但代价是代码库里堆满了没用的垃圾。写代码时的那种灵感迸发,很容易在随后的几次迭代中,留下大片毫无用处的死代码。

    如果把开发比作运行一个长期进程,这些死代码就是内存泄漏,只会让系统的复杂度无意义地膨胀。

    解决办法其实很简单,不需要人类去肉眼扫描,直接交给工具。对于 Python 开发者,Ruff 和 Vulture 是个好组合:前者负责规范和清理,后者负责寻找那些看起来没被使用的逻辑。有网友提到,甚至可以直接把这个指令复制给 Claude Code,让它自己跑一遍。

    不过要小心,这类工具并不是万能的。有观点认为,如果调用链太长超出了上下文窗口,AI 可能会误判。有些开发者更倾向于在 CI 流程中加入 Knip(针对 JS/TS)或者使用类似 python-doctor 的 pre-commit hook,把清理动作固化到每次提交里。

    最理想的状态是建立一个闭环:用工具识别死代码,配合端到端测试确保逻辑没断,最后让 AI 完成重构。

    虽然有人调侃这种自动化操作可能会“误删整个应用”,但比起看着代码库变成一堆不可控的乱码,这种风险值得承担。毕竟,如果代码质量的下降速度超过了清理的速度,那我们离真正的软件崩溃也就不远了。

    现在的核心问题是:在 AI 生成代码的浪潮下,我们的测试覆盖率和验证逻辑,跟得上这种生产力的膨胀吗?
  7. 为什么 AI 框架偏爱 Python?底层逻辑一次讲清 | 帖子

    Python 在 AI 中的角色更像是调度员。通过封装 C++ 和 CUDA 的高性能算子,它用人类可接受的开发效率,换取了机器层面的极致性能。

    有人会觉得奇怪,既然 C++ 或 Rust 这么快,为什么 AI 工具全用 Python?在处理大规模矩阵运算时,Python 的执行速度确实慢得惊人。

    真相是,Python 从不参与重体力活。它扮演着经理的角色。当你运行 PyTorch 时,Python 只负责分发指令。真正的计算发生在底层的 C++ 库或者 GPU 的 CUDA 内核里。这种高层封装模式让 Python 看起来很轻量。

    如果直接用 C++ 开发,实验成本会变得极高。研究人员需要在一周内尝试几十种架构,频繁的编译等待会耗尽精力。在科研阶段,改动一行代码并立即看到结果的灵活性,比那几毫秒的执行差距更重要。AI 领域的竞争本质上是在比拼人类的迭代速度。

    这种分层结构在生产环境里会有变化。当模型需要大规模部署时,大家会转向 TensorRT 或 XLA 这种极致优化的引擎。研究用 Python,部署用高性能底层。

    有网友提到,AI 正在改变编程的门槛。如果 AI 能快速写出 Rust,低级语言或许会在未来迎来复兴。

    目前的架构里,Python 的边界在哪里?
  8. 从对话框到生产力引擎:深度拆解 Claude 的四个进化阶梯 | 帖子

    大多数人对 Claude 的认知仍停留在“更好用的聊天机器人”,但这仅仅是冰山一角。Anthropic 正在构建的不是一个问答工具,而是一套完整的数字劳动力体系。根据 Ruben Hassid 总结的“Claude 层次论”,我们可以将 AI 的应用深度分为四个阶段。

    + 第一层:基础对话(Claude Chat)
    这是 90% 用户的停留地。在这个阶段,你把它当作加强版的搜索引擎或文案助手。
    - 核心逻辑:即时输入,即时反馈。
    - 进阶技巧:始终选择 Opus 4.6 + Extended Thinking 模式以获取深度推理;善用 Artifacts 功能,让 AI 直接生成可交互的图表、代码原型和计算器,实现视觉化输出。
    - 局限性:缺乏长期记忆,每次对话都是“初次见面”。

    + 第二层:协同办公(Claude Cowork)
    当 AI 开始读取你的本地文件并理解你的个人偏好时,它才真正成为你的“数字同事”。
    - 核心逻辑:建立个人上下文(Context)。
    - 关键动作:安装桌面端应用,让 Claude 直接读取并生成 .docx 或 .xlsx 文件。
    - 深度思考:与其不断上传文件,不如编写一份高质量的“全局指令”(Global Instructions)和“背景文件”(如 about-me.md)。一份精准的背景定义,胜过 50 次重复的 Prompt 调优。让 AI 适应你的风格,而不是你每次去迁就它。

    + 第三层:技能与插件(Skills and Plugin)
    这一层级实现了从“单次任务”到“自动化工作流”的跨越。
    - 核心逻辑:教给 AI 确定性的技能。
    - 关键动作:通过 SKILL.md 定义可重复的工作流,让 Claude 在特定场景下自动触发预设动作。
    - 行业集成:利用 Excel 插件直接在表格内进行数据清洗和建模;使用官方提供的营销、法律、金融等 11 个专业插件包。
    - 启发:真正的效率不在于你跑得有多快,而在于你构建了多少个可以“边睡觉边运行”的自动化闭环。

    + 第四层:代码与计算机控制(Code + Computer)
    这是目前 AI 的最高形态:从“建议者”变为“执行者”。
    - 核心逻辑:接管硬件与环境。
    - 关键能力:Claude Computer 允许 AI 直接控制屏幕、点击和导航;通过 MCP(Model Context Protocol)连接 Playwright 或 Figma 等专业工具。
    - 终极形态:在 CLI(命令行界面)中运行整个业务。通过并行智能体(Parallel Agents)批量处理销售、提案和外发任务。

    AI 的竞争已经从“模型参数”转向了“环境接入能力”。一个人能否在未来胜出,取决于他能为 AI 提供多少高质量的上下文,以及敢于交付多少控制权。

    从“给我写一段话”到“帮我运行这个业务”,这中间隔着的不是技术门槛,而是思维的鸿沟。不要只把 Claude 当成一个说话好听的秘书,要把它当成一个可以无限扩展的数字大脑。