Skip to main content

黑洞资源笔记

  1. DeepSeek押注Agent:从“会聊天”到“会干活”

    服务宕机12小时的热搜还没凉,DeepSeek悄悄挂出了17个岗位。

    全部指向同一个方向:Agent。算法研究员、数据评测专家、基础设施工程师,连产品经理都单独开了Agent方向。岗位描述里有一句话值得注意——“重度使用Claude Code、Cursor等AI编程工具者优先”。一家AI公司在招聘时明确要求候选人用竞品工具,这本身就是一种表态。

    所谓Agent,用最直白的话说:让AI从“被问才答”变成“自己想、自己干、干完自己检查”。规划任务、调用外部工具、多步执行、长期记忆。过去大模型像一个问答机,Agent更像一个能独立跑任务的进程。底层模型是CPU,Agent才是跑在上面的操作系统。

    有观点认为,底层模型的能力已接近某种边际,接下来的竞争转移到“训练Agent”和评测基础设施。这个判断大概是对的。参数规模的军备竞赛跑到一定程度,差距开始在别处显现——谁能把模型的能力接进真实工作流,谁能让Agent在复杂任务里不乱、不循环、不幻觉。

    DeepSeek-V3.2已经把思考推理和工具调用融进了正式版,此次招聘像是给这个方向补人手。有网友提到,宕机之后DeepSeek的编码风格突然发生变化,加上支持超长上下文,外界猜测内部正在测试新架构。招聘和模型迭代同步出现,这个时间点不像巧合。

    年薪最高154万,实习生待遇也不含糊。钱堆在强化学习、评测、基础设施这几块,说明DeepSeek很清楚卡点在哪。一个Agent系统能不能用,不只取决于模型聪不聪明,还取决于评测数据集够不够准、运行时环境够不够稳、工具调用够不够可靠。这些都是脏活,也都是护城河。

    有观点认为接下来半年内Agent会彻底改变工作流,很多执行类岗位将被替代。这个时间表可能太激进,但方向大概没错。

    真正没解决的问题是:Agent的自主性和可控性之间的张力。让它更自主,就更容易偏;约束得越死,又回到了问答机。这不是招几个工程师能解决的事,更像是一个还在跑的实验。
  2. Claude Code的真正优势藏在引擎盖下面 | 推文

    Claude Code的代码库近日遭到泄露,内部实现细节随之浮出水面。它比网页版聊天界面强的地方,不是模型本身,而是一整套精心设计的上下文管理和工具调用机制。换句话说,同样的模型,装进不同的软件框架,表现会差很远。

    最近Claude Code的TypeScript源码在GitHub上短暂出现过,随即引发广泛讨论。在撇开法律问题之后,它揭示了一个值得深想的问题:为什么同一家公司的同一个模型,放在网页端和放在Claude Code里,用起来感觉像两个东西?

    答案大概不在模型权重里。

    Claude Code启动时会主动拉取当前git分支、最近提交记录、CLAUDE.md等信息,这是它比网页聊天"懂代码库"的起点。更有意思的是它的缓存策略:静态内容和动态内容之间有明确的边界标记,静态部分全局缓存,不用每次重算。这有点像操作系统里的写时复制,脏页才走慢路径,干净的页直接复用。

    工具层面也有讲究。它没有直接通过Bash调grep,而是用一个专门的Grep工具,权限处理和结果收集都在自己掌控里。还有独立的Glob工具做文件发现,以及LSP接入,支持调用层级查找、引用跳转这些功能。网页端看代码更像读静态文本,Claude Code看代码更像真的在跑一个Language Server。

    有观点认为,这些工具的加入本质上是把IDE的能力注入给了模型,而不是让模型自己去猜文件结构。

    上下文膨胀是代码Agent最容易翻船的地方。反复读文件、长日志、来回对话,context很快就满了。Claude Code在这里做了几件事:文件读取去重,检测文件没有变化就不重新处理;工具返回的结果如果太大,写到磁盘,context里只放预览加文件引用;超长context自动触发压缩和摘要。

    这些加在一起,本质上是在做一个手动管理的内存层级,告诉模型什么值得放在寄存器里,什么扔到硬盘就好。

    还有一个细节:Claude Code维护一个结构化的Markdown会话记录,包含当前状态、任务说明、涉及的文件和函数、错误与修正、工作日志等部分。这个设计很像人类程序员写scratch pad的习惯,只是被系统化地内置进去了。

    子Agent和fork机制倒不新鲜,fork出来的Agent复用父级缓存,同时感知可变状态,可以在不污染主循环的情况下跑摘要、提取记忆或做后台分析。

    原作者有个判断,大概70%可信:如果把DeepSeek或其他模型塞进这套框架里,稍作适配,编程表现也会大幅提升。模型是硬件,这套软件框架才是系统软件,性能由两者共同决定。

    这留下一个没解决的问题:如果框架比模型更关键,那未来coding agent的竞争,会不会最终变成一场上下文管理工程的军备赛?
  3. Claude Code开源编译版来了!free-code 是一款免费的 Claude Code 版本,去除了所有遥测,移除了安全提示限制,开启了全部实验功能,完整解锁开发潜能!

    它是基于 Anthropic Claude Code CLI 打造的终端AI编码助手,支持多种高级功能:
    - 完全无遥测,保护隐私不“回传”;
    - 移除安全提示guardrails,释放模型潜力;
    - 启用45+实验特性,如远程多代理策划、深度思考模式、语音输入、IDE远程控制、任务验证等;
    - 支持macOS / Linux(Windows可通过WSL);
    - 简单安装,自动检测系统环境,自动安装依赖并构建二进制程序。

    安装方式也极其友好:
    curl -fsSL https:// raw.githubusercontent.com/paoloanzn/free-code/main/install.sh | bash
    export ANTHROPIC_API_KEY="sk-ant-..."
    free-code


    这意味着开发者可以在终端直接享受一个强大的AI编程助手,提升写代码效率、自动化任务调度、语音交互编程都不在话下。
  4. 在线使用 Claude Code AI API 时,面对高频率、多维度的设备指纹和遥测信息,隐私保护成了大难题。

    motiful/cc-gateway 是一个 AI API 身份网关,作为 Claude Code 和 Anthropic API 之间的反向代理,能彻底规范设备指纹和遥测数据,帮你掌控离开网络的隐私信息。

    项目主要特点:

    - 完整身份重写,将设备ID、邮箱、会话数据统一化为单一的标准身份;
    - 替换超过40个环境维度,包括平台、架构、Node版本等;
    - 系统提示和进程指标脱敏,防止硬件差异暴露身份;
    - 集中管理OAuth,实现免浏览器登录,所有刷新和鉴权均由网关处理;
    - 防止遥测泄露,剥除可能暴露代理的信息字段;
    - 三层防护架构:环境变量强制路由 + 网络层域名屏蔽(Clash规则) + 身份数据智能重写。

    非常适合需要隐私安全和统一身份管理的 AI 开发者,用命令行快速部署,支持 Docker 和多平台。

    主要用途:保护 AI API 用户隐私,绕过多设备身份追踪,简化身份授权流程。
  5. 在线开发界面往往需整合多种功能,调度多个AI模型来提升效率,管理复杂的工作流也极具挑战。

    Claude Code Best Practice 是一套以Claude AI为核心,围绕“实践造就完美”设计的智能代码开发最佳实践集合。

    它涵盖了Agent、Commands、Skills等模块,支持多模型协同、自动权限管理、持续代码审查和自动化工作流程,能极大地提高代码质量和开发效率。

    主要亮点:

    - 多层次Agent分工,针对不同任务细化角色,提升上下文聚焦;
    - 丰富Commands实现日常开发命令自动化,减少重复操作;
    - 灵活Skills支持上下文分叉执行,模块化管理知识和代码片段;
    - 支持持续集成环境中的多模型代码审查,自动发现bug和安全隐患;
    - 强大的Hooks系统,自动格式化、权限控制,确保代码安全合规;
    - 支持计划模式(Plan Mode)带有多阶段测试,保障开发质量;
    - 具备本地和云端调度的周期性任务功能,提升自动化能力;
    - 内置调试工具和状态栏,实时上下文与成本监控,友好易用。

    该项目兼容CLI和VS Code等开发环境,适合想借助大模型系统化提升研发流水线的团队和研发者。
  6. LLM能说服你,也能说服你相信完全相反的事 | 帖子

    Karpathy花四小时用LLM打磨论点,觉得无懈可击,然后让它论证反方,被当场说服。LLM不是真理机器,是说服机器,这个差异比大多数人意识到的要重要得多。

    Andrej Karpathy最近发了条帖子,简洁到有点喜剧效果:写好一篇博文,用LLM磨了四小时论证,感觉天衣无缝,心情很好。然后随手让它论证反方观点,LLM把自己的论点彻底拆烂,而且他被说服了。

    然后他写了个“lol”。

    这个“lol”背后其实是个严肃的问题。LLM不在乎你的论点是什么,它在乎你让它说什么。它优化的是局部连贯性和听起来有说服力,不是真相。所以它可以帮你把一个烂论点打磨得光可鉴人,也可以在五分钟内把它拆成碎片,用的是同等水平的PhD腔调。

    有网友一针见血:“如果它能流利地论证两面,说明的是它的修辞能力,不是你论证的正确性。被说服只代表你的反驳门槛太低。”

    也有观点认为,这个特性反过来可以用。与其把LLM当思想的放大器,不如当压力测试机。在发文前,专门让它找你论点的三个最大漏洞,让它扮演最挑剔的批评者而不是最热情的编辑。还有人在构建multi-agent系统,让不同模型盲评、相互攻击,用隔离上下文的方式对抗天然的讨好倾向。

    真正的问题是:我们习惯用“听起来有没有道理”来判断一个论点好不好。LLM恰好极其擅长让任何东西都听起来有道理。我们过去缺的不是正确答案,是足够好的反驳。现在这个障碍消失了,却多了一个新问题:你愿不愿意在发布前主动让它把你的论点砸烂一遍?
  7. Jevons悖论:AI工具越好用,对开发者需求越大 | 帖子

    AI没有缩小软件开发市场,而是把市场扩大了100倍。真正消失的不是开发者需求,而是"只会写代码"这个岗位。

    有个做MVP开发的创业者发帖,说他今年业务量翻倍了,不是因为别人不会建东西了,而是因为现在每个人都在建东西。

    这背后是一个古老的经济规律在发威,Jevons悖论:当一种资源变得极度高效,人们不会用得更少,而是找到一千个以前从没考虑过的使用场景。蒸汽机没有减少煤炭消耗,它让煤炭变得如此有用,需求反而爆炸。

    两年前,一个没有技术背景的创始人想做SaaS,要么学六个月编程,要么花十几万外包。大部分人选择了第三条路:把想法烂在备忘录里。现在,同一个人周末就能用AI工具搭出原型。你以为这让开发者失业了,实际上发生的是:每个建出"半成品"的人,都立刻需要帮助把它变成能跑在生产环境里、安全且可扩展的真实产品。

    入门门槛降到零,市场没有缩小,而是多了几百万个新入口。

    有意思的是,反驳声音也很集中。有观点认为,AI迟早能处理产品决策、用户访谈、功能取舍这些"人类判断"的部分。原帖作者的回应很直接:代码从来就不是最难的部分。难的是搞清楚该建什么、为谁建、什么时候该砍掉一个功能。这些问题的输入本身就是混乱的、人性化的,AI解决不了,因为问题还没被清晰地提出来。

    有网友提出了更犀利的分层:初级开发者正在被快速挤压,写CRUD接口这类活确实在消失。但能判断"AI在哪里自信地出错了"的高级工程师,成了每个项目的瓶颈。技能溢价从语法转移到了判断力,这个变化比很多人意识到的要快。

    还有人提到,CS毕业生找不到工作,是因为公司不再需要"会写for循环的人",需要的是能把模糊问题变成用户愿意付钱产品的人。这两个需求根本不是同一件事,却长期被同一个职位名称混淆了。

    真正值得想的问题是:如果会AI的一个人能顶以前三到五个人,工资天花板会怎么变?软件越来越多,开发者薪资会跟着涨,还是因为"人人会编程"而变成商品?

    这个问题没有人答得出来。
  8. 用普通笔记本跑大模型,不再是梦 | 帖子

    Google的TurboQuant算法被移植进llama.cpp后,MacBook Air(M4, 16GB)终于能在20000 tokens上下文下运行Qwen 3.5-9B,而此前直接崩溃。这不是什么颠覆,但确实把“不可能”变成了“可以接受的慢”。

    一台最便宜的MacBook Air,能跑20000 tokens上下文的9B模型,而且不崩溃。

    这就是TurboQuant带来的变化。Google这个压缩算法的核心思路不是直接暴力压缩数据,而是改变数据的存储格式,让KV缓存用极坐标(角度)而非直角坐标来表示,顺带去掉了传统量化方案里必须附带的精度校正常数,还加了1bit错误修正。普通的q4量化相当于把一张全彩图片强行降成16色,TurboQuant更接近视觉无损压缩,模型“看起来”还是原来那张图。

    有网友测试后指出,同等bit数下TurboQuant比llama.cpp原生的KV cache量化质量更好,尤其在3bit时差距明显。至于有多接近无损,Google官方说90%以上,实测结果众说纷纭,差距基本在噂1%级别。

    目前TurboQuant还没合并进llama.cpp主线,不过社区已经有可编译的实现,有网友预测本周内就能进主分支。MLX版本在路线图末端,不过已经有人提前做了PR。

    20000 tokens对于真正的AI agent来说其实还很小,Claude Code的系统提示就有12k。本地设备离长上下文代理仍有距离,只是这个距离,今年开始以肉眼可见的速度在缩短。
  9. 在线利用各种AI工具写提示词,常常要反复尝试、浪费大量token和时间。

    Prompt Master 是一个专为Claude设计的技能,能帮你精准生成适合任何AI工具的高效提示词,最大限度减少无效调用。

    Prompt Master 自动识别目标AI,结合任务、上下文、风格等9个维度智能生成最精简有力的提示语,避免无意义啰嗦和反复修正。它支持Claude、ChatGPT、Midjourney、GitHub Copilot等二十多款主流AI工具,且内建35个常见的“坑”避免策略,还有内存区块功能,确保跨对话一致性。

    主要亮点:
    - 超精确:每个词都承载意义,帮你一键拿到想要答案
    - 多场景:写代码、生成图片、设计Prompt都能胜任
    - 智能提问:缺信息时最多问你3个问题,快速补全需求
    - 跨工具:支持20+ AI平台,不用为切换写法烦恼
    - 开源免费,MIT许可,方便本地定制和集成

    无论你是AI初学者还是资深产品经理、开发者,这款Prompt Master都能帮你高效产出、节省费用
  10. 在线上使用Claude Code时,发现学习曲线比较陡峭,官方文档多为功能列表,缺少实操方法,导致很多强大功能没能充分发挥。

    Claude How To 是一份从入门到高级的可视化、示例驱动教程。它不仅涵盖了slash命令、内存、技能、子代理、 hooks、MCP协议、插件等全部Claude Code核心功能,还有实用的拷贝即用模版,帮你快速构建自动化代码审查、文档生成、DevOps流水线等复杂工作流。

    项目特点:

    - 十大教学模块,手把手带你玩转Claude Code全功能;
    - 丰富的Mermaid流程图,帮你搞懂背后的原理和机制;
    - 复制粘贴的配置文件和脚本,秒速搭建示例项目;
    - 内置自测功能帮你检测学习盲点,定制个性化学习路径;
    - 开源免费,MIT协议,支持离线生成EPUB电子书阅读。

    适合各阶段开发者,特别是想用Claude Code构建智能自动化开发流程的团队和开源爱好者。

    快速开始只需15分钟,复制一个slash命令试试就能立刻体验;全套学习路径大概11-13小时深入掌握。