黑洞资源笔记

15:49 · Feb 13, 2026 · Fri

让 Claude Code 真正好用的六个插件 | 帖子 | #插件

用 AI 写代码最怕什么？能跑但丑，能用但乱，声称没问题结果一堆 bug。这几个插件专治这些毛病。

1. Superpowers：大项目必备。它会启动子代理做调研，先想清楚再动手。内置 TDD 和系统化调试流程，防止 Claude 写完就说"搞定了"然后一运行全是错。

2. Frontend Design：让 Claude 真正在意视觉。生成的组件不再是千篇一律的模板脸，字体、间距、配色都会有意识地打磨。做落地页和仪表盘的时候特别有用。

3. Code Simplifier：功能跑通之后用它清理代码。专门针对最近改动的文件，把 Claude 写出来那些"能用但看着难受"的代码收拾干净。

4. Playground：一行命令生成独立的 HTML 工具，数据可视化、设计探索器、概念图都行。单文件，零依赖，浏览器打开直接用。

5. Claude in Chrome：让 Claude 能看到浏览器、点按钮、填表单。调试线上页面、抓数据、自动化重复操作，直接用你登录好的会话，不用单独处理认证。

6. PR Review Toolkit：一组专门的代码审查代理，分别负责测试覆盖率、错误处理、类型设计、代码质量。每个代理只管一件事，比单次审查更彻底。

一个进阶玩法：让 Claude 和 Codex 互相审查对方的代码，交叉检验能发现不少问题。

工具的价值在于组合。规划用 Superpowers，界面用 Frontend Design，完成后用 PR Review。先把一个用熟，再叠加下一个，最终你会开始写自己的插件。

插件

15:46 · Feb 13, 2026 · Fri

AI研究员的提示词工具箱：哪些真有用，哪些是玄学 | 帖子

有人声称采访了12位来自OpenAI、Anthropic和Google的AI研究员，总结出他们共同使用的10个提示词。这份清单在社交媒体上广泛传播，但真正有意思的是评论区里一位用户让Claude自己评价这些技巧，得到了一份相当诚实的答案。

先说确实有效的几个：

「展示推理过程」和「思考预算」本质上是同一件事：强迫模型把思维链条外化。这在数学、逻辑和复杂分析任务上效果显著，有大量研究支撑。给模型更多token去思考，确实能换来更好的推理质量。

「验证链」要求模型先回答问题，再列出可能出错的地方，最后自我修正。这种内置的自我纠错机制真的能抓住模型原本会自信地犯下的错误。

「对抗性质询」让模型反驳自己的答案，是避免AI变成你观点回音壁的最佳方式之一。模型天生过度自信，这个技巧强迫它保持智识上的诚实。

「边缘案例猎手」在代码审查和系统设计中特别有用，能暴露模型的盲点。

再说效果因场景而异的：

「约束强制」确实能让输出更简洁，「不要使用模糊语言」这个指令在去除废话方面出奇有效。「比较协议」在你指定比较维度时效果更好，否则模型会挑自己方便的角度。

「不确定性量化」可以做，但说实话，模型给出的置信度数字更多是一种「感觉」，没有经过校准。当作方向性参考就好，别太当真。

最后是被高估的：

「专家角色扮演」，那种「你是一位有15年经验的资深专家」的写法，大部分是表演。模型要么懂这个领域，要么不懂，角色设定可能稍微改变语气，但不会解锁什么隐藏知识。

「格式锁定」要求输出JSON格式，这只是正确使用工具的方式，算不上什么秘密技巧。

真正的元教训是：最有效的提示词都在做同一件事，给模型提供结构和约束。清晰的预期带来清晰的输出，这和一个好老板给出清晰需求是一个道理。

这些技巧本身都是实用的沟通原则，只是被包装成了「研究员内部秘密」来获取流量。没有什么隐藏的研究员知识，有的只是好的沟通方式。

01:18 · Feb 12, 2026 · Thu

据俄媒 RBC 报道，俄罗斯国家通讯监管机构Roskomnadzor reportedly已开始对加密通讯应用Telegram实施降速并限制访问，理由是Telegram在打击诈骗和犯罪活动方面措施不力。

Roskomnadzor去年8 月曾部分封锁Telegram和WhatsApp的语音通话功能，称这两款应用被用于勒索和“恐怖主义活动”。同一时期，俄罗斯还要求手机和平板厂商在在俄销售的新设备中预装国家主导的 Max 即时通讯应用，以推动本土替代方案的普及。

——cnbeta

01:06 · Feb 12, 2026 · Thu

迅雷旗下公司推出「光鸭云盘」，号称免登录下载和支持三方应用连接。可以通过播放器直连云盘并刮削数据搭建自己的影视库以及 4K 分辨率播放。

光鸭云盘看起来主要是对标阿里云盘，后者支持三方应用连接直接播放内容，但矛盾在于直接播放内容需要大量带宽，所以阿里云盘现在对此类使用需求收费，估计光鸭云盘也无法避免此类问题。

光鸭云盘具有如下特点：

-小型文件免登录快速下载，对于 100MB 以下的分享文件不需要登录即可下载
-为用户提供更大的空间，用户注册后即可获得 2TB 空间，最高支持 500TB 空间
-支持多种云下载协议，包括普通链接、磁力链接、ED2K 以及种子解析等
-最高支持上传高达 100GB 的单文件，满足部分用户需要上传超大文件的痛点
-提供 API 允许第三方应用对接，例如播放器类应用可以直连并支持海报刮削等
-支持原画无损播放，最高可以支持 4K 分辨率播放且支持最高五倍速播放

——蓝点网

16:27 · Feb 10, 2026 · Tue

一份值得收藏的AI社区导航手册 | 帖子

在信息爆炸的时代，找到高质量的学习社区比掌握任何单一技能都重要。Reddit用户JensPetrus花了大量时间整理了一份AI相关子版块的完整清单，覆盖了从大语言模型到图像生成、从自动化工作流到AI编程的几乎所有领域。

这份清单的价值在于它的筛选标准：活跃度高、有教育意义或能带来灵感启发。

通用AI讨论区包括ArtificialIntelligence、PromptEngineering、GenerativeAI等，适合了解行业动态和交流使用心得。AIToolTesting专门分享各类工具的实测体验，是发现新工具的好去处。

大语言模型板块最为丰富。ChatGPT相关的就有好几个：ChatGPT是最大的综合社区，ChatGPTPro面向专业用户分享工作流和进阶技巧，ChatGPTPromptGenius则专注于提示词优化。此外还有OpenAI、Anthropic、ClaudeAI、GeminiAI、PerplexityAI、DeepSeek、Grok、MistralAI、QwenAI、LocalLLaMA等，几乎覆盖了市面上所有主流模型。

图像和视频生成领域同样热闹。Midjourney和StableDiffusion是两个最大的图像生成社区，Veo3专门展示谷歌视频生成器的作品，KlingAIVideos和HiggsfieldAI则聚焦其他视频工具。

AI音乐创作以SunoAI为主阵地，这是目前最受欢迎的AI音乐平台。UdioMusic因为下载限制，热度已经下降不少。

AI写作社区相对小众但很专注，WritingWithAI是最大的一个，BookwritingAI则专门讨论用AI写书。

AI编程是当下最火的应用场景之一。VibeCoding和ClaudeCode是两个最大的社区，ChatGPTCoding专注于用ChatGPT写代码，Cursor则围绕这款热门AI编程工具展开讨论。OnlyAIcoding特别适合没有编程基础的人，大家在这里分享策略和提示词。

工作自动化方面，n8n和Zapier是两个主流平台的官方社区，AI_Agents专门讨论能自主执行任务的智能代理。

研究导向的社区包括MachineLearning这个2009年就创建的老牌版块，以及关注技术奇点的Singularity。

有用户建议创建一个多版块聚合订阅，这样可以一次性关注所有相关内容。已经有人做好了现成的聚合链接，感兴趣的可以去原帖查看。

学习AI最高效的方式，是把自己放进一个持续产出高质量内容的信息环境里。这份清单就是一张入场券。

16:22 · Feb 10, 2026 · Tue

当AI开始自动给你的代码库提PR，我们该担心什么 | 文档

GitHub刚刚发布了一个野心勃勃的新项目：Agentic Workflows。设想一下，每天早上你打开电脑，发现代码库里已经躺着几个自动生成的PR，文档更新了，测试覆盖率提高了，CI失败被自动分析了，Issue也被自动分类了。听起来很美好，对吧？

这套系统的核心思路是把AI编程代理塞进GitHub Actions里，用Markdown文件定义任务，然后让Copilot、Claude或Codex这些模型去执行。官方强调了安全设计：默认只读权限、沙箱执行、网络隔离、工具白名单。

但社区的反应相当精彩。

有人挖出了一个真实案例：Dependabot创建了一个版本升级的Issue，AI代理接手后，没有用正确的go get命令，而是直接在go.mod里加了一个replace语句。这根本不是正确的做法。更离谱的是，PR里还混入了一些无关的改动，AI审查员指出了问题，但人类维护者没注意就直接合并了。

这暴露了一个根本性问题：AI代理并没有真正理解它在做什么，它只是在模式匹配字符串，然后生成看起来正确的新字符串。

类似的问题在npm的package.json里也很常见。代理不会用npm install命令，而是直接编辑JSON文件，然后幻觉出一个版本号。重命名变量时更糟糕，代理不会用IDE的重构工具，而是暴力用字符串替换，然后编译、看报错、再改，烧掉大量算力。

有开发者分享了应对策略：在提示词里明确写上「添加依赖时用cargo add，不要指定版本」，问题就消失了。但这治标不治本，当上下文窗口变长，模型遵循指令的能力会下降。

更深层的担忧是：执行安全和决策验证是两回事。权限控制解决的是代理能做什么，但真正的失败往往来自代理在权限范围内做了错误的事情，而且信心满满。

还有人吐槽GitHub的优先级问题。Actions的核心功能还有一堆bug没修，付费用户遇到问题一年了还没解决，现在却在往上面堆AI功能。有开源维护者直言：我交的钱被拿去搞AI噱头，而不是改进核心产品，这让我很恼火。

域名选择也引发了争议。官方用的是github.github.io而不是github.com，这违反了人们被教导的防钓鱼规则。GitHub自己说过github.io是用户生成内容的域名，官方内容应该在github.com上。现在自己打脸，等于在训练用户忽视域名安全。

不过也有人看到了价值。把代理放在一个能访问CI、Issue和源码的中心化平台上，确实是个合理的位置。关键是要把AI调用和实际应用分开，这个架构思路是对的。

项目团队在评论区积极回应，承认这还是早期研究，欢迎反馈。他们修复了一些被指出的问题，包括那个go.mod的案例。

自动化本身其实不是问题，问题是我们还没有好的方法来验证AI的决策质量。代码不只是字符串，它承载着组织的知识。让AI慢慢改进代码库是个好想法，但前提是每一步都经过人类审视。否则，你得到的不是助手，而是一个需要你不断收拾烂摊子的实习生。

16:15 · Feb 10, 2026 · Tue

当所有人都在吹捧OpenClaw时，我决定读一遍它的源码 | 帖子

最近OpenClaw火得一塌糊涂，媒体铺天盖地的报道让我产生了怀疑。通常这种阵仗，背后往往是普通东西被包装得太好。

于是我花时间读完了它的开源代码。结论是：2%的常规技术，98%的营销泡沫。

核心功能其实就两件事：通过即时通讯软件和大语言模型聊天，以及让模型调用你电脑上的工具。这两样都不是什么新鲜玩意。

媒体吹嘘的"神奇浏览器操控能力"，根本不是OpenClaw的能力，而是微软Playwright库的能力。Playwright本身就是为程序化控制浏览器而生的，内置视觉模型能把屏幕内容转成文字描述。OpenClaw只是在中间传话而已。

典型工作流程是这样的：你说"帮我在亚马逊买个手电筒"，OpenClaw把消息扔给大模型，大模型决定用Playwright打开亚马逊，Playwright返回页面描述，大模型再决定搜索什么、点击什么。整个过程中，OpenClaw就像个跑腿的，模型说什么它做什么。

我翻遍源码，没找到其他值得一提的东西。所谓的"记忆系统"就是把对话存成文本文件，用grep搜索。

这是个不错的业余项目，但仅此而已。

然后评论区炸了。

有人说我漏掉了定时任务、多模型支持、统一网关、子代理协调这些功能。有人说Linux也只是GNU工具的"胶水代码"，iPhone也只是芯片和触摸屏的"胶水代码"，Uber也只是GPS和支付接口的"胶水代码"。

这个类比很有意思，但也恰恰说明了问题所在。

真正让我停下来思考的是几个真实用户的反馈。一位律师说他的代理两天内整理了海量法律模板，还能协调日程、做法律研究。一位数据分析师终于可以边散步边用语音指挥代理生成可视化图表，不用再被钉在显示器前。一位完全不懂技术的朋友正在用它实现做游戏的毕生梦想。

还有人用它学德语，把它当成超级智能的Anki卡片。有人让它每天早上自动生成一个新应用。有人用它管理整个智能家居。

我承认，把现有组件以正确的方式组合在一起，本身就是一种创造。苹果没有发明图形界面，但把它带给了普通人。

不过我依然认为，理解一个东西的技术本质和承认它的实用价值是两回事。OpenClaw的价值在于降低了门槛，让非技术用户也能调动这些能力。但这不改变它在技术层面确实没有原创性的事实。

集成工作很重要，但我们也不必把集成工作神话成技术突破。

16:12 · Feb 10, 2026 · Tue

你的照片正在出卖你的位置 | 帖子

最近一个叫GeoSpy的AI工具在社交媒体上引发热议。它号称能通过你发布的照片精准定位你的所在地。

这其实不是什么新技术。反向图片搜索、EXIF元数据提取、地理位置数据库早就存在多年。真正改变的是这些能力被包装成了傻瓜式界面，任何人都能上手。有评论者指出，那些GeoGuessr游戏高手比如Rainbolt，凭肉眼就能做到类似的事情。

但问题恰恰在这里。以前你要找到一个人的位置，需要真正的人类技能。现在这种能力被“民主化”了，门槛降到了地面。

真正的隐私风险不是工具本身，而是你照片里泄露的信息量远超你的想象。街道标识、建筑风格、植被特征、窗户倒影，交叉比对几张照片就能快速三角定位。更不用说很多人根本不知道自己的照片里还藏着GPS坐标。

有人分享了一个真实案例：乌拉圭一位检察官和妻子去哥伦比亚卡塔赫纳度假，毒贩通过他妻子发的Instagram照片追踪到他们，随后将他暗杀。

还有人提到那条古老的忠告：别在度假时发度假照，因为那等于告诉全世界你家现在没人。入室盗窃从未消失，瘾君子们也会刷社交媒体。

防护措施其实不复杂。不要实时发布位置信息，避免暴露日常动线规律，上传前手动清除元数据。更重要的是做好威胁建模，想清楚你真正需要防范的是谁。

目前GeoSpy已经限制了访问权限，只对企业和执法机构开放。这是好事也是讽刺。工具可以用来找回被绑架的儿童，也可以用来追踪前任。在这个问题上，善与恶之间只隔着一个用户协议。

有人评论说：想象一下军方和情报机构手里的工具是什么级别。

这大概是整个讨论中最清醒的一句话。

15:49 · Feb 10, 2026 · Tue

打开AI黑盒：让大模型的内部结构肉眼可见 | 帖子 | 项目地址 | 在线体验 | 经典参考

我们每天都在使用大语言模型，但它们内部究竟长什么样？一位开发者决定不再把模型当成黑盒来对待。

Reddit用户sultan_papagani开发了一个小工具，可以上传任意的gguf格式模型文件，用类似3D的方式可视化它的内部结构：层、神经元、连接关系，一目了然。开发者自嘲这只是个粗糙的原型，但社区反响热烈。

这个工具的核心价值在于：它让抽象的模型参数变成了可以旋转、缩放、漫游的空间结构。你可以用键盘在神经网络的层级间穿梭，看到每个权重的实际数值如何影响节点的颜色。有人评论说这像赛博朋克游戏里的黑客小游戏，某种程度上确实如此，只不过你破解的是人工智能的大脑。

技术实现上，它只读取gguf文件的头部信息，在浏览器端用纯HTML和JavaScript完成渲染，完全离线运行。这意味着你不需要把模型上传到任何服务器，隐私安全。

讨论中涌现出不少相关资源。有人提到Brendan Bycroft两年前做的LLM可视化项目堪称经典，但无法加载自定义模型。还有Neuronpedia这个开源项目，专注于模型可解释性研究，可以追踪特定概念在神经网络中的激活路径。另一位开发者曾经做过动态可视化，能显示模型推理时的激活模式，可惜账号已删除。

有用户提出了一个诱人的想法：能不能让可视化实时播放推理过程？想象坐在VR里，看着神经网络在处理每个token时逐层点亮，这对理解模型行为会有多大帮助。

AI发展飞速，但帮助人们理解AI的可视化工具严重滞后。理解你使用的工具，和盲目信任它，是两种完全不同的关系。

15:46 · Feb 10, 2026 · Tue

当AI能做到80%，你的价值在哪里？| 帖子

看到一个很有意思的讨论。一位软件开发者抱怨：两个客户原本要找他做项目，一个是AI工具的记忆系统整合，另一个是房地产资产管理系统。结果两个客户突然说，他们用Claude Code自己就能搞定。开发者看了他们做出来的东西，评价是“勉强算个原型”。

他很郁闷：怎么让这些“不懂软件的商业人士”明白，软件从0做到80%很容易，但从80%到100%才是真正的噩梦？

评论区的反应很有意思，分成了泾渭分明的两派。

第一派是“等着他们来求你”。大部分有经验的开发者都持这个观点：让他们先去撞墙吧。那20%的差距包含了安全漏洞、边界情况处理、负载均衡、错误监控、数据迁移等等一堆“不在需求文档里”的东西。原型在3个测试用户时跑得很欢，300个用户时就会崩溃。有人甚至当场黑了一个客户准备上线的“vibed coded”应用，演示了安全问题，看着他们脸色一变。建议很实际：保持优雅，递上名片，告诉他们遇到问题随时联系。几个月后接到求助电话时，报价因“通货膨胀”涨20%。如果要收拾AI留下的烂摊子，那就涨200%。而且别答应修补，直接要求从头重写，反正现在写代码已经不费事了。

第二派则提出了一个更尖锐的问题：也许80%对他们来说就够了，而你才是那个被颠覆的人。

如果两个完全不同的客户不约而同地想到了同一件事，这不是巧合，这是市场反馈。你在卖工程上的完美，但他们只需要一个现在就能用的商业解决方案。如果他们那个“勉强算原型”的工具省了一大笔钱还解决了眼前的问题，那他们就赢了。

这个观点戳到了一个很现实的地方：过去软件开发者的护城河是“只有我能写代码”。但当代码本身变得廉价，真正的价值应该是领域知识、持续支持、数据策略，以及AI工具无法从提示词里搞清楚的那些复杂整合。

有几条建议特别中肯。一位评论者说：别再把自己定位成“写代码的人”，开始把自己定位成“交付可靠性的人”。给客户展示他们的原型和生产系统之间的差异：缺失的访问限制、SQL注入漏洞、没有监控。把风险具象化、可视化。另一位评论者建议转向FUD策略，也就是恐惧、不确定性和怀疑。问客户三个问题：软件出问题谁来修？修一次要花多少钱？最后谁来为这个决定负责？

最让我觉得深刻的是这段话：被AI原型坑过一次的商业人士，会成为你最好的长期客户。而那些从来没被坑过的，本来也不会为质量付费。

事实是这样的：原型的成本已经趋近于零。但一个能持续迭代、能不断增加功能的产品，和一个能跑起来的原型，完全是两回事。当代码变得廉价，你能提供的稀缺资源是什么？这可能是每个靠写代码为生的人都要认真思考的问题了。

15:41 · Feb 10, 2026 · Tue

当AGI广告遇上服务器宕机：一场价值七千万美元的尴尬

超级碗期间，一则“AGI即将到来”的广告引爆了科技圈的讨论。广告背后是Crypto.com的CEO Kris Marszalek，他刚刚豪掷七千万美元买下了ai.com这个域名，创下公开披露域名交易的历史新高。

然而，接下来发生的事情堪称行为艺术。

当数百万观众涌向这个价值连城的网站时，他们看到的是一个504网关超时错误页面。有人调侃说：“他们的自主AI代理确实让网站加载速度变快了，方法是把整个网站删掉了。”另一位评论者更是联想到了《机械公敌》的剧情。

七千万买个域名，三千万投个超级碗广告，结果连基础的服务器扩容都没做好。这大概是2026年开年以来最昂贵的一次技术翻车。

更耐人寻味的是网站的内容本身。在短暂能够访问的时候，用户发现这个号称要“加速AGI到来”的平台，充斥着区块链项目标配的空洞词汇：“去中心化自主进化AI代理网络”、“动态自我演进的多代理架构”。一位用户吐槽：说好的去中心化平台，结果注册要用谷歌账号。

最令人警觉的是，网站要求用户输入信用卡信息来“证明你是人类”。这个设计让不少人直接关掉了页面。有用户机智地使用了虚拟信用卡完成注册，但也坦言“最大的骗局广告投在超级碗上也不是不可能”。

这件事折射出当下AI领域的一个普遍现象：营销预算远超技术投入。能花一亿美元做品牌曝光，却搞不定一个高并发网站，这种错位本身就很说明问题。

有人问AGI什么时候来。也许该先问问：连pie chart都画不好的模型，距离AGI还有多远？一位每天使用AI工作的用户分享了他的经历：让模型画个12段的饼图，标签重叠到无法阅读，反复提示五次，模型承认错误、道歉，然后继续重叠。

技术圈总喜欢说“这是用户的技能问题”。但当模型自己都承认做错了却无法改正时，这显然不是用户的问题。

AGI是否即将到来，我不知道。但我知道的是，任何宣称要改变世界的项目，如果连最基本的用户体验都无法保障，那它改变的可能只是你的钱包。

15:31 · Feb 10, 2026 · Tue

把你的抓狂时刻变成职业资产 | 帖子

有人问我职业发展最重要的建议是什么。我的答案只有一个：建立一条从「这破玩意儿怎么不工作」到「我是怎么搞定这蠢东西的」的内容管道。

这个世界上的技术问题，大多数都很蠢。每个人都会卡在同样愚蠢的地方。如果你被困住了，一定有人正在经历同样的痛苦。把解决过程写下来。

有人问：为什么要写？是为了做好人吗？

不完全是。写作对你的灵魂有好处。

这话听起来有点玄，但背后的逻辑很实在。当你把凌晨两点改配置文件的经历写成文章，你做的不只是记录，而是在强迫自己把模糊的直觉变成清晰的认知。很多时候我们「修好了」一个问题，其实并不真正理解它。写作会逼你想明白。

有个开发者分享说，他最受欢迎的文章标题永远是某个报错信息，加上简短的解决方案。这就是需求。没有人搜索「优雅的技术架构」，大家搜索的是那串让人崩溃的错误代码。

另一位说，他的技术信誉就是这么建立起来的。每修一个bug就发一条推文，帮助遇到同样问题的人。调试到内容的管道，本质上是免费的分发渠道。

有人担心：现在写博客不就是给AI提供训练数据吗？

这个担忧可以理解，但换个角度想：你的文章被AI学习，说明它有价值。而且AI能学会的是知识，学不会的是你解决问题的思维路径和持续输出的习惯。这些才是真正的护城河。

还有人说得更直接：这条管道是很多人没有放弃的唯一原因。把挫败感转化成内容，本身就是一种情绪出口。

最有意思的观察来自一条评论：真正的管道是，写博客本身变成了职业，而调试永远不会停止。

这就是闭环。你的痛苦变成别人的解药，别人的关注变成你的机会，新的机会带来新的问题，新的问题产生新的内容。

所以下次当你对着屏幕骂街的时候，记得打开一个文档。你的抓狂时刻，是最好的写作素材。

15:29 · Feb 10, 2026 · Tue

AI写代码比我快千倍，上网却像个第一天摸电脑的新手 | 帖子

这是一个让人意想不到的时刻：AI模型写代码的速度已经比我快上一千倍，但用浏览器上网却比我慢十倍。

它能从零开始写出一个编译器，却在网页面前显得手足无措，仿佛第一次接触互联网。

这种能力上的巨大反差，揭示了一个被忽视的真相。

代码是逻辑的纯文本表达，规则清晰，边界明确。网页则是为人类眼睛设计的视觉迷宫，充满了按钮、表单、弹窗和广告。AI目前处理网页的方式是不断截图、分析、再截图、再行动，这种“看一步走一步”的笨拙方式，效率自然高不到哪里去。

更深层的瓶颈在于：网页庞大且碎片化，跨页面没有共享记忆状态。模型每次都要从头理解整个页面结构，就像一个失忆的人在陌生城市里反复认路。

有人开始尝试解决这个问题。比如构建互联网的共享状态地图，让AI拥有跨页面的连贯记忆。也有人认为，让AI通过API直接获取数据，比逼它模仿人类点击鼠标要靠谱得多。

毕竟浏览器从来不是为AI设计的。

最核心的洞见来自一位开发者的观察：代码生成的速度已经解决了，但代码生成与可靠执行之间的协调层，才是真正的瓶颈。我们还没解决协作问题。

这种能力的错位创造了一个诡异的“生产力倒挂”现象。开发者现在花在调试浏览器奇奇怪怪的问题和研究API文档上的时间，反而比写核心逻辑还多。AI能重构整个代码库，却点不对一个按钮。

还有开发者提到，AI写的代码会制造出一种“外星Bug”，那些沉默失败的错误，比显而易见的功能性Bug更难捉摸。

值得思考的是，这种局面可能只是过渡期的短暂现象。

当AI需要像人类一样去“看”界面、点按钮、填表单，这本身就是一种错配。未来的方向大概率是AI通过专门的协议与系统直接对话，数据以AI能理解的格式呈现，而非困在人类界面的像素迷宫里。

那个不需要打开浏览器窗口、一切自动化操作都在后台悄然发生的时代，可能比我们想象的更近。

浏览器，正在成为新时代的瓶颈。

14:06 · Feb 8, 2026 · Sun

前几天差点儿买了Dler