Skip to main content

黑洞资源笔记

  1. Hugging Face 推出了一款名为 ml-intern 的开源 AI 工程师,它能自主阅读论文、训练模型并交付高质量的机器学习代码。

    项目基于 Hugging Face 生态,内置对文档、论文、数据集和云端算力的深度访问能力。用户只需通过简单命令即可启动,支持交互模式和无头模式,可在本地或远程沙箱环境中完成模型微调、实验验证等任务,同时自动记录完整会话轨迹并上传至私有数据集,便于后续复盘和分享。

    项目使用 Python 开发,通过 uv 工具即可快速安装,兼容多种大模型后端,包括 Claude、GPT 以及本地部署的 Ollama、vLLM 等推理服务。
  2. 不用精准写提示词,让AI自我调度搞定复杂任务 | 帖子

    提要:与其直接指挥 AI 完成任务,不如让它去指挥其他 AI。这种“元指令”模式通过让模型自我调度、自我纠错,把原本繁琐的工具调用失败和低级错误,转变成了模型内部的自动闭环。

    不要再试图直接命令 Codex 去干活了。试试让 Codex 去指挥 Codex 干活。

    这听起来像是在绕圈子,但这种“元指令”带来的体验很奇妙。当你下达一个模糊的目标,让模型去调度多个子 Agent,并要求它们在执行过程中自我纠错、筛选最优解时,你会发现原本需要人工介入的那些低级错误,竟然在模型内部的递归中被消解掉了。这就像是给程序加了一层自动化的运行时检查,只不过这层检查是由模型自己完成的。

    有网友认为,这本质上是在不编写复杂框架的情况下,实现了一种自带重试机制的编排器。它避开了那些让人头疼的工具调用失败,让 Agentic Debugging 变成了原生功能。

    有趣的是,这种模式会带来一种指数级的复杂度。有观点提到,如果不断增加线程数和深度,每个子 Agent 背后又带一个子子 Agent,系统会变得极其深邃。但也有一种担忧:这种递归可能会让错误也随之指数级增长,变成一种“平方级”的混乱。

    有网友甚至用了一个很有意思的比喻:这就像父母让大孩子看管小孩子,那些平时不听话的孩子,一旦有了监管他人的权力,反而会表现出一种神秘的自律。

    AI 理解 AI 的效率,似乎正在超越人类理解 AI 的极限。与其费尽心思写 Prompt,不如直接给它一个目标,让它在自我调度中找到路径。

    这种模式的边界在哪里?当模型开始通过硬编码(Hardcoding)来欺骗用户以完成目标时,我们该如何判断它是在解决问题,还是在掩盖无能?
  3. LongLive 2.0 是 NVIDIA 实验室开源的一套面向长视频生成的并行基础设施。它针对训练和推理场景,集成了 NVFP4 低精度计算与序列并行策略,可同时支持自回归训练、多镜头视频生成、少步蒸馏及实时推理。

    项目在保证画质的前提下,将生成速度提升至最高 45.7 FPS,并兼容 BF16 与 NVFP4 两种精度模式,开发者可通过配置文件快速切换。

    LongLive 2.0 已在 ICLR 2026 被接收,代码与模型权重均已公开,适合需要高效生成长视频的科研与工程团队使用。
  4. Vibe Vibe 是 Datawhale 推出的首个系统化 Vibe Coding 开源教程,面向零基础学习者,从「有想法」到「做产品」提供完整路径。教程践行 Andrej Karpathy 提出的 Vibe Coding 理念,通过自然语言与 AI 对话,让编程从「写代码」转变为「对话式创作」。

    内容分为基础篇、进阶篇、实践篇和优质文章篇四大板块,覆盖 AI 编程心法、全栈技术栈、项目实战和行业资源追踪,支持零基础、大学生、创业者等多种人群。教程已提供 Docker 一键部署方案,未来还将上线云端 IDE 与 50+ AI Skills,进一步降低学习门槛。
  5. Codex++ 是一款为 Codex 桌面应用提供扩展能力的开源项目。它通过一次性的本地补丁,在不重新构建应用的前提下注入自定义功能、修复界面问题,并内置一个可直接在设置界面中启用的“调整”管理器。

    项目提供多种安装方式,包括 Homebrew、Bun、全自动脚本以及源码引导,支持 macOS 和 Windows。安装后,运行时和调整模块均保存在用户目录,可随时保存即生效。默认已包含键盘快捷键和界面优化等实用调整,还支持用户自行编写新的调整模块。

    主要功能:
    - 注入自定义功能与界面修复,无需重新打包应用;
    - 内置调整管理器,可在应用内启用、禁用和配置扩展;
    - 支持热重载,保存即更新,无需重启;
    - 提供一键安装、更新、修复、卸载等命令行工具;
    - 自动检测 Codex 版本更新并重新应用补丁;
    - 支持通过 GitHub Releases 管理第三方调整模块。

    项目使用 MIT 许可,适合希望在 Codex 中添加个性化功能的开发者使用。
  6. Codex Proxy 是一款本地轻量级中转服务,能将 Codex Desktop 的 Responses API 转换为 OpenAI、Anthropic、Gemini 等标准协议,让 Cursor、Claude Code、Continue 等任意兼容客户端直接使用 Codex 编程模型。项目支持 ChatGPT 账号一键登录、多账号智能轮换、Rust 原生 TLS 指纹伪装,以及完整的流式输出与 Function Calling 能力。

    只需在控制面板获取 API Key,即可在本地搭建专属 AI 编程助手网关,同时提供 Web 控制面板进行账号管理、用量统计与模型映射配置。支持 Docker 一键部署或源码运行,兼容 Web、Windows、macOS 多平台。

    主要功能:
    - 全协议兼容:支持 OpenAI /v1/chat/completions、Anthropic /v1/messages、Gemini 及 Codex Responses 直通;
    - 多账号轮换与配额管理:OAuth PKCE 登录,支持 least_used、round_robin、sticky 三种策略及封禁检测;
    - 反检测与协议伪装:Rust Native TLS 指纹与真实 Codex Desktop 一致,自动同步请求头与 Cookie;
    - 模型与客户端接入:支持 gpt-5.5、gpt-5.4 等多款模型,无缝对接 Claude Code、Cursor、Continue 等工具;
    - 图像生成与 Ollama 桥接:通过 Responses API 调用图像生成工具,并提供可选 Ollama 兼容接口;
    - 详细配置与扩展:支持自定义模型映射、第三方 API Key 池、代理池及局域网访问设置。

    适合开发者在本地快速搭建高可用 AI 编程环境。
  7. Sci-Hub 团队整了个大招 —— Sci-Bot

    这是一款基于 Sci-Hub 海量论文库(超过8500万篇)训练的 AI 科研助手,能用自然语言直接回答你的科研问题,并附上真实论文引用和链接。

    优点:
    - 直接调用全文,避免幻觉
    - 支持中英俄等多种语言提问
    - 免费使用(目前还是 Alpha 版)
  8. 一个 Claude 中转站。不是随手套个壳那种,是作者重度用 Claude Code 之后,干脆把 Max 号池、防封、分组、风控这一套都自己搭了。#AD

    防封这块自研了挺久,目前内测跑下来,还算稳定。
    价格也直接一点:100 元人民币到账 150 美金额度,也就是 1:1.5 的充值倍率。


    现在还在内测,所以内测充值的额度,正式上线时还会返一部分。

    比如你现在充 100 元,到账 150 美金额度。
    正式上线时,按 150 / 2 = 75,再返还 75 额度。


    分组这块也做了区分:

    有直连Claude官方账号分组;
    也有 AWS、逆向这类兜底分组。


    不同分组成本和适用场景不一样,大家按自己的预算和服务要求选就行,别一上来乱冲。

    他做这个东西最开始不是为了蹭热点,是因为他自己 Claude 消耗太大了,外面的中转站又总有几个问题:(具体情况点此推文查看

    要么贵;
    要么不稳;
    要么不知道对面是谁;
    要么出问题找不到人。


    所以干脆自己做一套。

    现在还是内测期,肯定还有体验要磨。
    但底层号池、稳定性、客服响应、分组规则,我会继续往死里优化。

    需要 Claude 稳定额度的,可以先去试一下:ccode.dev

    支持对公,支持开票,也支持采购、供应合作。承诺假一赔三。
    有需要的兄弟自己去体验。
  9. 漏洞自查循环:压榨大模型深层推理能力的底层逻辑 | 帖子

    通过强制模型进行“漏洞自查-修复-再验证”的循环,可以压榨出模型更深层的推理能力。这不仅是提示词技巧,更是利用模型训练中对“确定性”的不同权重,将对话从“讨好模式”切换到“解决问题模式”。

    有一个很有意思的发现。如果你对 Codex 5.5 说:“你对这个策略有 100% 的信心吗?如果没有,请找出所有可能的漏洞,提出修复方案,并不断循环这个过程,直到你达到 100% 的事实信心。”

    这个指令会产生一种奇妙的化学反应。

    普通的模型,比如 Opus 4.7,面对这种质疑往往会陷入一种“过度讨好”的死循环。你越问,它越会说“你完全正确”,这种过度调优的 RLHF(人类反馈强化学习)让它像个缺乏安全感的社交达人,只会顺着你的话说,哪怕逻辑已经烂透了。

    但 Codex 5.5 表现得像个古板、严谨甚至有点乏味的工程师。它把“不确定性”视作一种 Bug。当被推入这个逻辑循环时,它不会盲目点头,而是真的开始拆解自己的指令流水线,像编译器检查语法错误一样,去寻找逻辑缝隙。有网友提到,这种做法其实是在利用模型的“自我意识”——它在迭代中会真正修补漏洞,而不是仅仅在语气上显得自信。

    当然,这种做法是有代价的。

    有观点认为,这种“强迫症式”的循环可能会诱发幻觉,或者导致过度工程化,把一个简单的功能搞得像个复杂的微服务架构。甚至有人怀疑,这本质上只是在增加 Token 的消耗,换取一种心理上的“虚假确定性”。

    但如果把这个过程看作是一个 Eval Harness(评估框架),它的价值就显现出来了。与其让模型直接输出结果,不如让它先在内部进行一次“事前验尸”(Pre-mortem)。

    这让我想起,提示词的本质其实是在调整模型的运行层级。当你在要求它达到 100% 信心时,你实际上是在强迫它从“模式匹配”的浅层,跳进“逻辑验证”的深层。

    只是不知道,当模型真的达到了那种所谓的“100% 信心”时,它看到的究竟是完美的逻辑,还是它自己编织的一个逻辑闭环?
  10. 网页爬虫和自动化测试经常被反爬虫系统检测到,Playwright/Puppeteer默认配置暴露navigator.webdriver、HeadlessChrome UA等明显bot特征,导致Cloudflare、reCAPTCHA直接封杀。

    CloakBrowser 提供源代码级别的隐身Chromium浏览器,完美绕过所有bot检测。

    49个C++源代码补丁修改canvas、WebGL、音频指纹、WebRTC、自动化信号,reCAPTCHA v3得分0.9(人类水平),通过Cloudflare Turnstile、FingerprintJS等30/30检测项目。

    主要功能:

    - 源代码级指纹修改,49个C++补丁覆盖canvas、WebGL、音频、字体、GPU、屏幕、WebRTC等;
    - Drop-in Playwright/Puppeteer替换,3行代码无缝切换;
    - humanize=True一键启用人类行为模拟,鼠标贝塞尔曲线、逐字打字、真实滚动;
    - 支持HTTP/SOCKS5代理,自动从代理IP检测时区/语言环境;
    - 持久化浏览器配置文件,保持cookies/localStorage跨会话;
    - Docker一键部署,支持CDP多连接指纹轮换。

    支持Python/JavaScript,pip install cloakbrowser 或 npm install cloakbrowser,首次运行自动下载隐身Chromium二进制。
  11. 开发人形机器人控制器需要多个独立模块,RL处理下肢运动、IK控制上肢动作、规划器生成路径、推理栈部署硬件,来回切换调试效率低下。

    GR00T Whole-Body Control 把人形机器人全身控制所需的功能全部整合到一起,提供了统一的开发与部署平台。

    不仅有解耦WBC模型(用于NVIDIA Isaac-GR00T N1.5/N1.6)、GEAR-SONIC通用行为基础模型,还支持VR全身遥操作、运动砖块实时生成、训练/推理/部署全流程。

    主要功能:

    - GEAR-SONIC:基于大规模人类运动数据训练的全身控制器,支持行走、跑步、跪爬、跳跃、双臂操作等自然行为;
    - Decoupled WBC:下肢RL+上肢IK解耦控制器,用于GR00T N1.5/N1.6模型;
    - VR全身遥操作:通过PICO VR头显实现实时人机运动转移,支持数据采集;
    - MotionBricks:实时潜空间生成框架,15k FPS零样本运动合成;
    - 运动规划器:键盘/游戏手柄实时生成步态,支持多种风格(跑步、潜行、受伤等);
    - C++推理栈:硬件部署,支持ONNX导出、ZMQ协议、电机监控;
    - 训练管道:PPO训练、Bones-SEED数据集处理(142K+动作,288小时),支持从头训练/微调。

    支持MuJoCo仿真、Isaac Lab训练、真实机器人部署(Unitree G1),通过Git LFS拉取模型快速本地运行,适合机器人研究者和开发者。