Skip to main content

黑洞资源笔记

  1. qiaomu-anything-to-notebooklm 是一款专为 NotebookLM 设计的多源内容处理器。它能将微信文章、网页、YouTube、PDF、Markdown 等 15 种不同来源的内容,自动转换成播客、PPT、思维导图、Quiz 等多种输出格式。

    核心亮点在于内置 6 层级联策略,可自动绕过 300 多个付费网站的付费墙,让 Claude 直接获取完整内容并上传 NotebookLM 生成目标文件。无论是付费新闻、播客音频还是电子书,都能通过自然语言指令完成转换。

    项目支持 Python 3.9+,通过一键安装脚本即可部署,适合需要频繁处理多源内容并生成结构化输出的用户。

    主要功能:
    - 支持微信、X、YouTube、播客、PDF、EPUB 等 15+ 内容源输入
    - 自动绕过 NYT、WSJ、FT 等 300+ 付费网站
    - 一键生成播客、PPT、思维导图、Quiz、报告等多种格式
    - 支持深度分析模式,自动生成 12 个递进式问题并输出结构化 JSON
    - 可将分析结果写入飞书文档
    - 提供安装脚本与环境检查工具,快速上手
  2. Hugging Face 推出了一款名为 ml-intern 的开源 AI 工程师,它能自主阅读论文、训练模型并交付高质量的机器学习代码。

    项目基于 Hugging Face 生态,内置对文档、论文、数据集和云端算力的深度访问能力。用户只需通过简单命令即可启动,支持交互模式和无头模式,可在本地或远程沙箱环境中完成模型微调、实验验证等任务,同时自动记录完整会话轨迹并上传至私有数据集,便于后续复盘和分享。

    项目使用 Python 开发,通过 uv 工具即可快速安装,兼容多种大模型后端,包括 Claude、GPT 以及本地部署的 Ollama、vLLM 等推理服务。
  3. 不用精准写提示词,让AI自我调度搞定复杂任务 | 帖子

    提要:与其直接指挥 AI 完成任务,不如让它去指挥其他 AI。这种“元指令”模式通过让模型自我调度、自我纠错,把原本繁琐的工具调用失败和低级错误,转变成了模型内部的自动闭环。

    不要再试图直接命令 Codex 去干活了。试试让 Codex 去指挥 Codex 干活。

    这听起来像是在绕圈子,但这种“元指令”带来的体验很奇妙。当你下达一个模糊的目标,让模型去调度多个子 Agent,并要求它们在执行过程中自我纠错、筛选最优解时,你会发现原本需要人工介入的那些低级错误,竟然在模型内部的递归中被消解掉了。这就像是给程序加了一层自动化的运行时检查,只不过这层检查是由模型自己完成的。

    有网友认为,这本质上是在不编写复杂框架的情况下,实现了一种自带重试机制的编排器。它避开了那些让人头疼的工具调用失败,让 Agentic Debugging 变成了原生功能。

    有趣的是,这种模式会带来一种指数级的复杂度。有观点提到,如果不断增加线程数和深度,每个子 Agent 背后又带一个子子 Agent,系统会变得极其深邃。但也有一种担忧:这种递归可能会让错误也随之指数级增长,变成一种“平方级”的混乱。

    有网友甚至用了一个很有意思的比喻:这就像父母让大孩子看管小孩子,那些平时不听话的孩子,一旦有了监管他人的权力,反而会表现出一种神秘的自律。

    AI 理解 AI 的效率,似乎正在超越人类理解 AI 的极限。与其费尽心思写 Prompt,不如直接给它一个目标,让它在自我调度中找到路径。

    这种模式的边界在哪里?当模型开始通过硬编码(Hardcoding)来欺骗用户以完成目标时,我们该如何判断它是在解决问题,还是在掩盖无能?
  4. LongLive 2.0 是 NVIDIA 实验室开源的一套面向长视频生成的并行基础设施。它针对训练和推理场景,集成了 NVFP4 低精度计算与序列并行策略,可同时支持自回归训练、多镜头视频生成、少步蒸馏及实时推理。

    项目在保证画质的前提下,将生成速度提升至最高 45.7 FPS,并兼容 BF16 与 NVFP4 两种精度模式,开发者可通过配置文件快速切换。

    LongLive 2.0 已在 ICLR 2026 被接收,代码与模型权重均已公开,适合需要高效生成长视频的科研与工程团队使用。
  5. Vibe Vibe 是 Datawhale 推出的首个系统化 Vibe Coding 开源教程,面向零基础学习者,从「有想法」到「做产品」提供完整路径。教程践行 Andrej Karpathy 提出的 Vibe Coding 理念,通过自然语言与 AI 对话,让编程从「写代码」转变为「对话式创作」。

    内容分为基础篇、进阶篇、实践篇和优质文章篇四大板块,覆盖 AI 编程心法、全栈技术栈、项目实战和行业资源追踪,支持零基础、大学生、创业者等多种人群。教程已提供 Docker 一键部署方案,未来还将上线云端 IDE 与 50+ AI Skills,进一步降低学习门槛。
  6. Codex++ 是一款为 Codex 桌面应用提供扩展能力的开源项目。它通过一次性的本地补丁,在不重新构建应用的前提下注入自定义功能、修复界面问题,并内置一个可直接在设置界面中启用的“调整”管理器。

    项目提供多种安装方式,包括 Homebrew、Bun、全自动脚本以及源码引导,支持 macOS 和 Windows。安装后,运行时和调整模块均保存在用户目录,可随时保存即生效。默认已包含键盘快捷键和界面优化等实用调整,还支持用户自行编写新的调整模块。

    主要功能:
    - 注入自定义功能与界面修复,无需重新打包应用;
    - 内置调整管理器,可在应用内启用、禁用和配置扩展;
    - 支持热重载,保存即更新,无需重启;
    - 提供一键安装、更新、修复、卸载等命令行工具;
    - 自动检测 Codex 版本更新并重新应用补丁;
    - 支持通过 GitHub Releases 管理第三方调整模块。

    项目使用 MIT 许可,适合希望在 Codex 中添加个性化功能的开发者使用。
  7. Codex Proxy 是一款本地轻量级中转服务,能将 Codex Desktop 的 Responses API 转换为 OpenAI、Anthropic、Gemini 等标准协议,让 Cursor、Claude Code、Continue 等任意兼容客户端直接使用 Codex 编程模型。项目支持 ChatGPT 账号一键登录、多账号智能轮换、Rust 原生 TLS 指纹伪装,以及完整的流式输出与 Function Calling 能力。

    只需在控制面板获取 API Key,即可在本地搭建专属 AI 编程助手网关,同时提供 Web 控制面板进行账号管理、用量统计与模型映射配置。支持 Docker 一键部署或源码运行,兼容 Web、Windows、macOS 多平台。

    主要功能:
    - 全协议兼容:支持 OpenAI /v1/chat/completions、Anthropic /v1/messages、Gemini 及 Codex Responses 直通;
    - 多账号轮换与配额管理:OAuth PKCE 登录,支持 least_used、round_robin、sticky 三种策略及封禁检测;
    - 反检测与协议伪装:Rust Native TLS 指纹与真实 Codex Desktop 一致,自动同步请求头与 Cookie;
    - 模型与客户端接入:支持 gpt-5.5、gpt-5.4 等多款模型,无缝对接 Claude Code、Cursor、Continue 等工具;
    - 图像生成与 Ollama 桥接:通过 Responses API 调用图像生成工具,并提供可选 Ollama 兼容接口;
    - 详细配置与扩展:支持自定义模型映射、第三方 API Key 池、代理池及局域网访问设置。

    适合开发者在本地快速搭建高可用 AI 编程环境。
  8. Sci-Hub 团队整了个大招 —— Sci-Bot

    这是一款基于 Sci-Hub 海量论文库(超过8500万篇)训练的 AI 科研助手,能用自然语言直接回答你的科研问题,并附上真实论文引用和链接。

    优点:
    - 直接调用全文,避免幻觉
    - 支持中英俄等多种语言提问
    - 免费使用(目前还是 Alpha 版)