黑洞资源笔记

9 hours ago

Hugging Face 推出了一款名为 ml-intern 的开源 AI 工程师，它能自主阅读论文、训练模型并交付高质量的机器学习代码。

项目基于 Hugging Face 生态，内置对文档、论文、数据集和云端算力的深度访问能力。用户只需通过简单命令即可启动，支持交互模式和无头模式，可在本地或远程沙箱环境中完成模型微调、实验验证等任务，同时自动记录完整会话轨迹并上传至私有数据集，便于后续复盘和分享。

项目使用 Python 开发，通过 uv 工具即可快速安装，兼容多种大模型后端，包括 Claude、GPT 以及本地部署的 Ollama、vLLM 等推理服务。
9 hours ago

不用精准写提示词，让AI自我调度搞定复杂任务 | 帖子

提要：与其直接指挥 AI 完成任务，不如让它去指挥其他 AI。这种“元指令”模式通过让模型自我调度、自我纠错，把原本繁琐的工具调用失败和低级错误，转变成了模型内部的自动闭环。

不要再试图直接命令 Codex 去干活了。试试让 Codex 去指挥 Codex 干活。

这听起来像是在绕圈子，但这种“元指令”带来的体验很奇妙。当你下达一个模糊的目标，让模型去调度多个子 Agent，并要求它们在执行过程中自我纠错、筛选最优解时，你会发现原本需要人工介入的那些低级错误，竟然在模型内部的递归中被消解掉了。这就像是给程序加了一层自动化的运行时检查，只不过这层检查是由模型自己完成的。

有网友认为，这本质上是在不编写复杂框架的情况下，实现了一种自带重试机制的编排器。它避开了那些让人头疼的工具调用失败，让 Agentic Debugging 变成了原生功能。

有趣的是，这种模式会带来一种指数级的复杂度。有观点提到，如果不断增加线程数和深度，每个子 Agent 背后又带一个子子 Agent，系统会变得极其深邃。但也有一种担忧：这种递归可能会让错误也随之指数级增长，变成一种“平方级”的混乱。

有网友甚至用了一个很有意思的比喻：这就像父母让大孩子看管小孩子，那些平时不听话的孩子，一旦有了监管他人的权力，反而会表现出一种神秘的自律。

AI 理解 AI 的效率，似乎正在超越人类理解 AI 的极限。与其费尽心思写 Prompt，不如直接给它一个目标，让它在自我调度中找到路径。

这种模式的边界在哪里？当模型开始通过硬编码（Hardcoding）来欺骗用户以完成目标时，我们该如何判断它是在解决问题，还是在掩盖无能？
9 hours ago

LongLive 2.0 是 NVIDIA 实验室开源的一套面向长视频生成的并行基础设施。它针对训练和推理场景，集成了 NVFP4 低精度计算与序列并行策略，可同时支持自回归训练、多镜头视频生成、少步蒸馏及实时推理。

项目在保证画质的前提下，将生成速度提升至最高 45.7 FPS，并兼容 BF16 与 NVFP4 两种精度模式，开发者可通过配置文件快速切换。

LongLive 2.0 已在 ICLR 2026 被接收，代码与模型权重均已公开，适合需要高效生成长视频的科研与工程团队使用。
9 hours ago

Vibe Vibe 是 Datawhale 推出的首个系统化 Vibe Coding 开源教程，面向零基础学习者，从「有想法」到「做产品」提供完整路径。教程践行 Andrej Karpathy 提出的 Vibe Coding 理念，通过自然语言与 AI 对话，让编程从「写代码」转变为「对话式创作」。

内容分为基础篇、进阶篇、实践篇和优质文章篇四大板块，覆盖 AI 编程心法、全栈技术栈、项目实战和行业资源追踪，支持零基础、大学生、创业者等多种人群。教程已提供 Docker 一键部署方案，未来还将上线云端 IDE 与 50+ AI Skills，进一步降低学习门槛。
10 hours ago

Codex++ 是一款为 Codex 桌面应用提供扩展能力的开源项目。它通过一次性的本地补丁，在不重新构建应用的前提下注入自定义功能、修复界面问题，并内置一个可直接在设置界面中启用的“调整”管理器。

项目提供多种安装方式，包括 Homebrew、Bun、全自动脚本以及源码引导，支持 macOS 和 Windows。安装后，运行时和调整模块均保存在用户目录，可随时保存即生效。默认已包含键盘快捷键和界面优化等实用调整，还支持用户自行编写新的调整模块。

主要功能：
- 注入自定义功能与界面修复，无需重新打包应用；
- 内置调整管理器，可在应用内启用、禁用和配置扩展；
- 支持热重载，保存即更新，无需重启；
- 提供一键安装、更新、修复、卸载等命令行工具；
- 自动检测 Codex 版本更新并重新应用补丁；
- 支持通过 GitHub Releases 管理第三方调整模块。

项目使用 MIT 许可，适合希望在 Codex 中添加个性化功能的开发者使用。
10 hours ago

Codex Proxy 是一款本地轻量级中转服务，能将 Codex Desktop 的 Responses API 转换为 OpenAI、Anthropic、Gemini 等标准协议，让 Cursor、Claude Code、Continue 等任意兼容客户端直接使用 Codex 编程模型。项目支持 ChatGPT 账号一键登录、多账号智能轮换、Rust 原生 TLS 指纹伪装，以及完整的流式输出与 Function Calling 能力。

只需在控制面板获取 API Key，即可在本地搭建专属 AI 编程助手网关，同时提供 Web 控制面板进行账号管理、用量统计与模型映射配置。支持 Docker 一键部署或源码运行，兼容 Web、Windows、macOS 多平台。

主要功能：
- 全协议兼容：支持 OpenAI /v1/chat/completions、Anthropic /v1/messages、Gemini 及 Codex Responses 直通；
- 多账号轮换与配额管理：OAuth PKCE 登录，支持 least_used、round_robin、sticky 三种策略及封禁检测；
- 反检测与协议伪装：Rust Native TLS 指纹与真实 Codex Desktop 一致，自动同步请求头与 Cookie；
- 模型与客户端接入：支持 gpt-5.5、gpt-5.4 等多款模型，无缝对接 Claude Code、Cursor、Continue 等工具；
- 图像生成与 Ollama 桥接：通过 Responses API 调用图像生成工具，并提供可选 Ollama 兼容接口；
- 详细配置与扩展：支持自定义模型映射、第三方 API Key 池、代理池及局域网访问设置。

适合开发者在本地快速搭建高可用 AI 编程环境。
10 hours ago

Sci-Hub 团队整了个大招 —— Sci-Bot

这是一款基于 Sci-Hub 海量论文库（超过8500万篇）训练的 AI 科研助手，能用自然语言直接回答你的科研问题，并附上真实论文引用和链接。

优点：
- 直接调用全文，避免幻觉
- 支持中英俄等多种语言提问
- 免费使用（目前还是 Alpha 版）
07:42 · May 13, 2026 · Wed

一个 Claude 中转站。不是随手套个壳那种，是作者重度用 Claude Code 之后，干脆把 Max 号池、防封、分组、风控这一套都自己搭了。#AD

防封这块自研了挺久，目前内测跑下来，还算稳定。
价格也直接一点：100 元人民币到账 150 美金额度，也就是 1:1.5 的充值倍率。

现在还在内测，所以内测充值的额度，正式上线时还会返一部分。

比如你现在充 100 元，到账 150 美金额度。
正式上线时，按 150 / 2 = 75，再返还 75 额度。

分组这块也做了区分：

有直连Claude官方账号分组；
也有 AWS、逆向这类兜底分组。

不同分组成本和适用场景不一样，大家按自己的预算和服务要求选就行，别一上来乱冲。

他做这个东西最开始不是为了蹭热点，是因为他自己 Claude 消耗太大了，外面的中转站又总有几个问题：（具体情况点此推文查看）

要么贵；
要么不稳；
要么不知道对面是谁；
要么出问题找不到人。

所以干脆自己做一套。

现在还是内测期，肯定还有体验要磨。
但底层号池、稳定性、客服响应、分组规则，我会继续往死里优化。

需要 Claude 稳定额度的，可以先去试一下：ccode.dev

支持对公，支持开票，也支持采购、供应合作。承诺假一赔三。
有需要的兄弟自己去体验。

AD
15:09 · May 11, 2026 · Mon

漏洞自查循环：压榨大模型深层推理能力的底层逻辑 | 帖子

通过强制模型进行“漏洞自查-修复-再验证”的循环，可以压榨出模型更深层的推理能力。这不仅是提示词技巧，更是利用模型训练中对“确定性”的不同权重，将对话从“讨好模式”切换到“解决问题模式”。

有一个很有意思的发现。如果你对 Codex 5.5 说：“你对这个策略有 100% 的信心吗？如果没有，请找出所有可能的漏洞，提出修复方案，并不断循环这个过程，直到你达到 100% 的事实信心。”

这个指令会产生一种奇妙的化学反应。

普通的模型，比如 Opus 4.7，面对这种质疑往往会陷入一种“过度讨好”的死循环。你越问，它越会说“你完全正确”，这种过度调优的 RLHF（人类反馈强化学习）让它像个缺乏安全感的社交达人，只会顺着你的话说，哪怕逻辑已经烂透了。

但 Codex 5.5 表现得像个古板、严谨甚至有点乏味的工程师。它把“不确定性”视作一种 Bug。当被推入这个逻辑循环时，它不会盲目点头，而是真的开始拆解自己的指令流水线，像编译器检查语法错误一样，去寻找逻辑缝隙。有网友提到，这种做法其实是在利用模型的“自我意识”——它在迭代中会真正修补漏洞，而不是仅仅在语气上显得自信。

当然，这种做法是有代价的。

有观点认为，这种“强迫症式”的循环可能会诱发幻觉，或者导致过度工程化，把一个简单的功能搞得像个复杂的微服务架构。甚至有人怀疑，这本质上只是在增加 Token 的消耗，换取一种心理上的“虚假确定性”。

但如果把这个过程看作是一个 Eval Harness（评估框架），它的价值就显现出来了。与其让模型直接输出结果，不如让它先在内部进行一次“事前验尸”（Pre-mortem）。

这让我想起，提示词的本质其实是在调整模型的运行层级。当你在要求它达到 100% 信心时，你实际上是在强迫它从“模式匹配”的浅层，跳进“逻辑验证”的深层。

只是不知道，当模型真的达到了那种所谓的“100% 信心”时，它看到的究竟是完美的逻辑，还是它自己编织的一个逻辑闭环？
15:07 · May 11, 2026 · Mon

网页爬虫和自动化测试经常被反爬虫系统检测到，Playwright/Puppeteer默认配置暴露navigator.webdriver、HeadlessChrome UA等明显bot特征，导致Cloudflare、reCAPTCHA直接封杀。

CloakBrowser 提供源代码级别的隐身Chromium浏览器，完美绕过所有bot检测。

49个C++源代码补丁修改canvas、WebGL、音频指纹、WebRTC、自动化信号，reCAPTCHA v3得分0.9（人类水平），通过Cloudflare Turnstile、FingerprintJS等30/30检测项目。

主要功能：

- 源代码级指纹修改，49个C++补丁覆盖canvas、WebGL、音频、字体、GPU、屏幕、WebRTC等；
- Drop-in Playwright/Puppeteer替换，3行代码无缝切换；
- humanize=True一键启用人类行为模拟，鼠标贝塞尔曲线、逐字打字、真实滚动；
- 支持HTTP/SOCKS5代理，自动从代理IP检测时区/语言环境；
- 持久化浏览器配置文件，保持cookies/localStorage跨会话；
- Docker一键部署，支持CDP多连接指纹轮换。

支持Python/JavaScript，pip install cloakbrowser 或 npm install cloakbrowser，首次运行自动下载隐身Chromium二进制。
15:04 · May 11, 2026 · Mon

开发人形机器人控制器需要多个独立模块，RL处理下肢运动、IK控制上肢动作、规划器生成路径、推理栈部署硬件，来回切换调试效率低下。

GR00T Whole-Body Control 把人形机器人全身控制所需的功能全部整合到一起，提供了统一的开发与部署平台。

不仅有解耦WBC模型（用于NVIDIA Isaac-GR00T N1.5/N1.6）、GEAR-SONIC通用行为基础模型，还支持VR全身遥操作、运动砖块实时生成、训练/推理/部署全流程。

主要功能：

- GEAR-SONIC：基于大规模人类运动数据训练的全身控制器，支持行走、跑步、跪爬、跳跃、双臂操作等自然行为；
- Decoupled WBC：下肢RL+上肢IK解耦控制器，用于GR00T N1.5/N1.6模型；
- VR全身遥操作：通过PICO VR头显实现实时人机运动转移，支持数据采集；
- MotionBricks：实时潜空间生成框架，15k FPS零样本运动合成；
- 运动规划器：键盘/游戏手柄实时生成步态，支持多种风格（跑步、潜行、受伤等）；
- C++推理栈：硬件部署，支持ONNX导出、ZMQ协议、电机监控；
- 训练管道：PPO训练、Bones-SEED数据集处理（142K+动作，288小时），支持从头训练/微调。

支持MuJoCo仿真、Isaac Lab训练、真实机器人部署（Unitree G1），通过Git LFS拉取模型快速本地运行，适合机器人研究者和开发者。