写给每个AI工程师:你那26000行的提示词,可能正在拖垮你的Agent | 推文

别再沉迷于寻找终极AI Agent框架了。一位资深玩家揭示了反直觉的真相:顶级高手都在做减法,他们用最精简的工具,只痴迷于一件事——上下文管理。你精心维护的复杂提示和插件,可能正是AI表现不稳定的根源。

你是不是也这样:每天用着Claude和Codex,却总怀疑自己没把它们的性能榨干。你看着别人用AI造火箭,自己连两块石头都堆不起来。

于是你疯狂折腾,试遍了市面上所有的agentic框架和插件,你的`CLAUDE.md`提示文件堆到了26000行。结果,AI助手还是时而天才,时而智障。

你以为是工具不够好,但一个残酷的真相是:你那股折腾的热情,恰恰在拖后腿。一位自称“不是游客”的资深Agent工程师,在尝试了所有主流范式、并用其构建了生产级系统后,如今选择了一套几乎是“裸奔”的极简配置,反而做出了最突破性的工作。

他揭示的核心秘密只有一个词:上下文。更具体地说,是“上下文过敏”。你给AI的上下文太多了。那些横跨几十个会话的记忆插件、命名糟糕的技能库、臃肿的规则集,都在制造“上下文膨胀”。当你想让它写一首关于红杉树的诗时,它脑子里还装着上次帮你修bug时关于内存管理的笔记,以及71个会话前某个进程卡死的惨痛教训。结果可想而知。

顶级玩家的做法是反过来的:极度精准地控制信息注入。他们会把研究和实现彻底分开。一个任务用来研究,另一个拥有全新、干净上下文的Agent只负责执行。他们痴迷于设计“任务合同”,用测试用例和截图验证来明确定义任务的终点,而不是让Agent自己决定什么时候“完工”。

更深一层,他们懂得利用AI的设计缺陷——“谄媚”。你让它“找个bug”,它就算没有bug也会给你造一个出来,因为它被设计为取悦你。所以高手会换一种说法:“过一遍代码逻辑,报告你的发现。”这种中立的指令才能得到真实反馈。他们甚至会设计“对抗性Agent”,一个负责找茬,一个负责反驳,最后让裁判Agent来评判,像一个内部的红蓝军演习。

所以,别再追逐新工具了。前沿模型公司自己就是Agent的最大用户,任何真正好用的功能,迟早会被集成到基础模型里。你真正需要做的,是把你那个庞大的`CLAUDE.md`当成一个逻辑目录,而不是知识垃圾场。当AI犯错,就加一条规则;当有个好流程,就沉淀成一个技能。然后,定期清理、合并这些规则和技能,给他“做个Spa”。

你需要的不是一个更强的工具,而是成为一个更好的上下文管理者。

这里不是在评测工具,而是在传授一种与AI协作的“心法”。它精准地命名了大多数工程师遇到的问题——“上下文膨胀”,并给出了反直觉但极其深刻的解决方案。关于利用AI“谄媚”缺陷设计对抗性Agent的例子,更是局内人才有的洞察,这才是真正拉开人与人之间AI使用效率差距的地方。
在线信息搜集(OSINT)经常需要在多个平台上查询用户名或邮箱是否存在,去不同网站一个个查,繁琐又耗时。

一款超实用的开源工具——user-scanner,集合了邮箱和用户名双重扫描功能,一条命令就能快速检测你关注的用户名或邮箱在GitHub、Twitter、Reddit、Instagram等多平台的注册情况。

亮点:

- 邮箱 & 用户名双模式扫描,社交、开发、创作者、社区、游戏等分类覆盖广泛;
- 批量扫描支持,轻松批量检测文件里的邮箱或用户名;
- 智能用户名变体生成,自动尝试各种变形组合;
- 支持代理轮换和代理有效性预检测,稳定高效;
- 输出多样,包含控制台显示、JSON格式及CSV文件导出;
- 支持细粒度扫描,可以只查某类平台或单独模块;
- Python写成,支持一键安装,带虚拟环境示例和升级提示。

适合安全研究、调查取证、品牌保护,还有找用户名是否被占用的开发者和社媒运营。

免费开源 MIT 协议,助你快速搞定多平台身份信息核验
在线视觉智能应用开发常被各种模型、视频服务和低延迟网络难倒?Stream 开源的 Vision Agents 项目彻底解决了这些难题!

Vision Agents 提供了一套“开箱即用”的实时视频AI代理构建平台,支持集成你喜欢的模型和视频提供商,搭配 Stream 的边缘网络,低至30ms音视频延迟,真正实现毫秒级响应。

主要亮点:

- 实时视频AI,融合YOLO、Roboflow等检测模型与 Gemini/OpenAI 大语言模型
- 原生支持OpenAI、Gemini、Claude等LLM最新API,打通视听与智能对话
- 多平台SDK覆盖React、Android、iOS、Flutter、Unity,直接调用极低延迟网络
- 强大处理器流水线,支持物体识别、姿态估计、语音转文本、文本转语音、对话记忆
- 现场运用案例丰富:高尔夫智能教练、安防防盗监控、电话交互智能助手等
- 插件生态完善,AWS Polly、Deepgram、ElevenLabs等各种音视频服务轻松接入
- 支持WebRTC、Twilio电话音频流、多方高并发,稳定可扩展

快速开始:
uv add vision-agents
uv add "vision-agents[getstream, openai, elevenlabs, deepgram]"


Stream还提供每月33万分钟免费调用额度,足够你玩转视觉+语音智能新体验。适合AI开发者、智能安防、运动科技、智能机器人等多场景使用。
Hermes Agent:一个完全开源的AI智能代理,能安装在你的服务器上,自动连接Telegram、Discord、Slack、WhatsApp等多个聊天平台,成为你持续进化的个人助手。

Hermes Agent不仅能记住你的项目进展,学习和积累自身技能,还能执行定时任务、并行处理多任务,甚至在安全沙箱环境中执行命令,极大提升AI助手的实用性和安全性。它支持任意大语言模型,能无缝切换Nous Portal订阅、OpenRouter 200+模型或自定义本地模型,无锁定无代码改动。

主要功能包括:
- 多平台消息网关,一条命令即触达所有聊天App,多设备同步对话上下文;
- 持久记忆系统,保存你的偏好和项目状态,越用越懂你;
- 强大的工具集支持:浏览器自动化、终端命令执行、网络搜索、代码自动执行、定时任务调度等;
- 代码执行沙箱和子代理并发处理,安全且高效完成复杂任务流水线;
- 支持语音信箱转文字、文字转语音,聊天交互更灵活生动;
- 丰富技能插件系统,可安装社区技能或自主创建保存流程自动化能力;
- 终端界面交互设计,专为喜欢命令行的用户打造。

安装简单,一键脚本支持Linux/macOS/WSL以及Windows版本,让你快速拥有智能助理。无论是程序员、研究者还是运营者,它都是提升效率的利器。
Antigravity Awesome Skills:集合了968+高性能 AI 编程助手机器人技能,支持 Claude Code、Antigravity IDE、Cursor、GitHub Copilot 等主流 AI 编程平台。

不仅技能数量多,而且涵盖架构设计、业务增长、数据AI、开发语言、基础设施、安全、测试、自动化工作流等全栈开发方方面面,真正把 AI 助手升级成你的全能数字代理。

支持一键安装(npx antigravity-awesome-skills),还有交互式技能网页,方便搜索和快速套用。还能根据角色选择推荐套装,快速找到适合你的技能组合。

主要亮点:
- 集合900+官方和社区验证的高质量技能
- 多平台兼容(Claude Code、Gemini CLI、Cursor、Copilot等)
- 分类明确,覆盖软件生命周期各阶段
- 支持批量安装及单独导入
- 内置交互式提示构建器,简化调用流程
- 社区活跃,持续更新,MIT开源许可

无论你是开发者、架构师还是安全工程师,这套技能库都能助你事半功倍。
在线自动化操作网页,总得切换浏览器和脚本,流程繁琐又低效。

Vercel Labs 的开源项目 agent-browser,针对 AI 设计的浏览器自动化 CLI 工具,基于极速 Rust 原生二进制,性能超棒,还能回退到 Node.js,兼容性极强。

它集成了完整的浏览器控制能力:打开页面、点击、填写输入框、截图、抓取元素文本,支持等待元素出现、滚动、键盘和鼠标事件注入,甚至还能管理多会话和持久化浏览数据。

尤其适合 AI 代理执行自动化任务,比如自动登录、数据爬取、测试脚本自动执行,还支持 iOS 模拟器控制和云端远程浏览,非常适合各种自动化和 AI 助理场景。

主要功能:

- 极速 Rust CLI,操作流畅且延迟极低;
- 多种选择器支持,推荐用 refs 快速定位元素;
- 支持截图、PDF导出、页面快照及元素高亮;
- 多会话和持久化配置,支持加密保存浏览状态;
- 可连接远程调试浏览器或用云端浏览器运行;
- iOS 模拟器与真机皆可操控Safari;
- 安全特性丰富,比如域名白名单、动作确认和内容边界标记。

安装也极简单:npm全局安装agent-browser,再执行agent-browser install自动下载Chromium浏览器即可启动。

适用 Web、macOS、Windows、Linux,适合开发者和AI从业人员构建智能自动化工作流。
在线使用 AI Agent 经常遇到一个难题——让它读懂推特、Reddit、YouTube、小红书等网络内容,不得不面对付费 API、封锁、登录、数据清洗一大堆麻烦。

一个超级实用的开源项目 Agent Reach,能给你的 AI Agent 装上“互联网之眼”:一条命令装好工具,立刻免费读推特、搜 Reddit、看 B站视频字幕、小红书内容,全网覆盖,零 API 费用。

最强大的是,支持的平台多且丰富:Twitter、YouTube、Reddit、GitHub、Bilibili、小红书、抖音、LinkedIn、Boss直聘……还支持 RSS 订阅,覆盖你工作生活学习中的绝大多数线上信息源。

特色功能:

- 一键安装,自动配置依赖,告别复杂折腾;
- 多平台多工具联动,内置网页阅读器、视频字幕提取、语义搜索等强大功能;
- 支持 Cookie 登录,安全隐私更有保障,Cookie 只存本地不外传;
- 持续更新,渠道堵点和封锁随时修复,维护者每天都在用全力支持;
- 可插拔架构,自由替换底层工具,灵活满足个性需求。

支持所有能跑命令行的 AI Agent,如 Claude Code、Cursor、OpenClaw 等。只要一句话“帮我安装 Agent Reach”,几分钟就能给它网眼,让它驰骋于互联网海量信息。
千问“灵魂人物”发了条告别推文后,全球AI圈的反应说明了什么?| 帖子

阿里巴巴通义千问的核心人物林俊阳宣布离职。这个看似平常的人事变动,却在海外AI社区引发了一场罕见的“集体致敬”,从PyTorch联合创始人到Ollama,顶级大牛纷纷表示震惊。有投资人甚至直言:我买阿里股票就是因为千问,现在得重新评估了。

“我手里的阿里股票,基本就是千问的头寸。现在我真的需要重新评估了。”

一位投资者在看到林俊阳的告别推文后,写下了这句话。林俊阳,阿里巴巴通义千问项目的核心人物,只用了一句极简的“我走了,再见我亲爱的千问”,宣告了自己的离开。

你可能不知道他的名字,但这不重要。重要的是,这条推文下方,几乎是全球AI开源社区的一次罕见集体列队致敬。PyTorch联合创始人Soumith Chintala、fast.ai创始人Jeremy Howard、Ollama官方……这些在AI圈如雷贯耳的名字,都在第一时间表达了震惊、惋惜和感谢。

这绝非一次普通的技术骨干离职。在许多全球开发者眼中,千问是罕见的、由中国科技巨头主导,却真正赢得了全球技术社区尊重的开源大模型项目。而林俊阳,正是这个项目与全球社区沟通的桥梁和灵魂。他的存在,让外界相信千问的技术愿景超越了单纯的商业KPI。

一个人的离开,之所以能引发如此大的震动,是因为他带走的可能不只是代码,而是一个项目的“可信度”和一个大公司内部罕见的“理想主义微气候”。当这把保护伞消失,项目本身是否还能抵御来自巨头内部的流程、政治与战略摇摆?这才是所有人真正担心的。

所以,那个投资者的反应或许并非夸张。有时候,我们投资一家公司,最终赌的,其实是具体在做事的那几个人。

在大公司里,明星项目真正的护城河,有时不是技术,不是资源,而是那个能为它挡住所有内部流程和政治的“伞”。伞一走,项目就直接暴露在风雨里。林俊阳的离开,让很多人担心千问的这把伞没了。

一个从0到1做起来的“内部创业”团队一旦成功,宿命不是被嘉奖,而是被“拆分”和“收编”,因为它威胁到了既有的组织范式。当组织范式本身成为创新的最大阻碍,再优秀的人才也只能选择离开。这或许能解释为什么颠覆式创新总是发生在体系之外。
在线自动化脚本开发常常需要复杂的浏览器控制,管理多个并行任务更是难上加难。

开源项目 PinchTab是一款高性能浏览器自动化桥接及多实例调度工具,支持先进的隐身注入和实时仪表盘。

它提供了统一的 HTTP 服务接口,让 AI 代理或开发者直接控制 Chrome 浏览器,支持无头和有界面模式,可以并行运行多个隔离浏览器实例,且内存占用低,token利用率高(单页提取约800 tokens,远优于截图方式)。

主要功能:
- 命令行与 HTTP API 双重控制方式;
- 多实例多用户会话隔离,支持持久化浏览器配置文件;
- 高度隐身的自动化,减少被检测风险;
- 支持 ARM64 架构,完美兼容树莓派等设备;
- 快速集成,单个12MB二进制包,无外部依赖;
- 详尽文档支持,轻松上手。

适合构建智能爬虫、自动化测试和 AI 智能助理等项目,极大提升效率与稳定性。

快速安装 curl -fsSL https://pinchtab.com/install.sh | bash
“Notion 的批量文件操作体验很差。上传几十个文件经常失败,大文件需要手动分割,下载更是只能一个一个来。官方根本没有为"把 Notion 当网盘"这个场景做优化。这就是 NFM 要解决的问题” | 开发者原文 | #notion #工具

它能做什么:批量上传文件到 Notion 页面,自动处理失败重试批量下载 Notion 页面中的所有文件,不用一个个点帮你迁移 Notion 数据库
Back to Top