黑洞资源笔记

14:02 · Jan 29, 2026 · Thu

像达芬奇一样思考：文艺复兴巨匠的四个思维习惯 | 文章

达芬奇几乎不懂拉丁文，没有正规学历，还是私生子。在那个年代，这些身份足以让一个人被社会边缘化。然而历史证明，很少有名字能像他一样穿越五百年依然熠熠生辉。

他设计桥梁和战争机器，解剖人体绘制神经系统图谱，创作出人类艺术史上最不朽的画作。他留下的数千页笔记涵盖机械草图、水流运动、宇宙结构等看似毫无关联的领域。

但这些成就并非天才的随机迸发。在表面的庞杂之下，是一套清晰连贯的思维方法。达芬奇的创造力不是神秘的天赋，而是可以被理解、甚至被学习的习惯。

一、让好奇心带路

达芬奇的笔记本里塞满了各种问题：鸟是怎么飞的？啄木鸟的舌头如何运作？血液怎样流经心脏？他的待办清单上写着：计算米兰的面积、描述鳄鱼的下颌、弄清楚月光如何在水面反射。

这些问题看起来毫无关联，但达芬奇不在乎。他相信好奇心自有其智慧，会把他带到该去的地方。这种做法确实让他积累了大量未完成的项目，但也让他推开了别人从未想过要敲的门。

关键在于，他的好奇心从不流于浅尝辄止。每一个引起他兴趣的对象，都会得到他全部的注意力。他不只是收集信息，而是在别人视而不见的地方发现意义。好奇心是发动机，专注力才是方向盘。

二、跨领域融合

达芬奇真正的天才不在于知道很多，而在于能让不同领域的知识相互照亮。

他研究水流的运动，这帮助他画出了更逼真的头发和衣褶。他解剖尸体研究肌肉结构，这让他能够“透视”人体，画出前所未有的精准人像。他相信自然界遵循着统一的模式：血液流过心脏的方式可能类似于水流绕过岩石，叶片的形状可能暗示着螺旋桨的设计原理。

这就是为什么他的笔记本上经常出现看似奇怪的并置：人体肌肉图旁边是滑轮系统，植物茎干旁边是车轴草图。这不是混乱，而是一种极致的综合思维在运作。

有评论者说得好：拒绝把世界切割成互不相干的孤岛，让你对世界的理解产生复利效应。

三、用手和眼睛思考

达芬奇不把思考和动手分开。他必须做出什么东西，才能真正理解它。

他很可能是一个动觉型学习者，通过身体的运动来认知世界：画、建造、触摸。那些海量的草图和模型不是他理解之后的产物，而是理解本身形成的过程。

当笔触落在纸上，当黏土在手中成形，想法才变得清晰。他的思维是具身的，占据着真实的物理空间。他比任何人都懂得身体如何塑造心智。

这给今天的创作者一个重要启示：不要等到想法完美了才动手，清晰是在做的过程中浮现的。

四、接受未完成的状态

达芬奇有太多作品没有完成。为斯福尔扎设计的巨型骑马雕像，耗费十年心血后被迫放弃。超过240幅人体解剖图，原本打算出版成医学参考书，最终未能付梓。甚至《蒙娜丽莎》从1503年开始创作，一直到1519年他去世时还在不断调整。

他不急于冲向终点线。他追求的是理解，而非完成。

这意味着很多作品永远不会以传统意义上的“完成”状态存在。但达芬奇不认为这是失败。他认为那些让他反复回去修改的作品，恰恰包含着某种永恒和无穷的东西。

他的创作方法是渐近线式的：永远在接近完美，永远不会真正抵达。每一次修改都让他更接近目标，同时也揭示出新的缺陷和改进空间。

面对这种永无止境，达芬奇的回应不是沮丧，而是热爱。热爱这趟旅程本身，热爱认识和理解自然世界的机会。

正如一位读者评论的那样：达芬奇展示了当好奇心、手艺和综合能力从同一个中心生长出来时会发生什么。他的作品之所以经久不衰，是因为每一次探索都在滋养同一种观看现实的方式。

五百年后，这种对知识的热爱和对成长的拥抱，依然在启发着我们。

14:00 · Jan 29, 2026 · Thu

你的文件夹命名方式，正在决定你的职业前途 | 帖子

Balaji最近说了一句话，听起来平淡，细想却惊心：如今大部分数字化工作，本质上都是在为AI准备上下文。

整理文件夹、规范命名、按正确顺序介绍背景，然后才是用清晰的语言向AI下达指令。

这话乍一听像是在描述一个助理的日常，但仔细琢磨，这其实是一场静悄悄的职场革命。

有个程序员说得很扎心：我有些朋友，文件命名规范，文件夹整洁，什么都写文档。这些事我以前都懒得做，因为我脑子记得住。但问题是，AI读不了我的脑子。突然之间，那些我觉得无聊的人，跑到我前面去了。

这就是当下最吊诡的逆转。过去我们嘲笑那些执着于文档、痴迷于分类的人是强迫症，现在他们成了AI时代的原住民。你欠下的文档债，终于到了还款日。

有人把这种能力叫做“上下文打包”，就是知道该放什么、该省什么、该按什么顺序呈现，才能让模型不会锚定在错误的信息上。这不是简单的整理术，而是一种面向非人类思维的元素养。

更深一层看，人类的角色正在发生根本性的位移。过去我们负责判断，现在我们负责让系统变得足够清晰，清晰到判断这件事本身都不再需要发生。权威从行动端移到了行动之前。

工作没有消失，只是往上游挪了一步。

有人问这是永久的技能层，还是暂时的摩擦？我倾向于认为，这是一种新的基础设施能力。就像打字曾经是专业技能，后来变成基本素养，清晰的书面表达和结构化思维，正在重新成为技术能力。

最有意思的一个评论是：我们现在的工作是世界构建，为transformer搭建它运行所需的临时宇宙。

所以下次当你随手把文件命名为“新建文档3”的时候，想想看，你可能正在亲手埋葬自己的竞争力。

13:59 · Jan 29, 2026 · Thu

Bob大叔的双Claude工作流：把AI当新人带的智慧 | 帖子

软件工程界的传奇人物Bob大叔最近分享了他使用AI编程的独特方法，引发了开发者社区的热烈讨论。

他的核心策略很简单：同时开两个Claude窗口，一个专门负责修改代码，另一个专门负责规划未来的改动。这样做的好处是，当一个Claude在执行任务时，他可以和另一个Claude讨论下一步计划，大幅减少了等待时间。

两个Claude分别在不同的目录下工作，各自有独立的git仓库。规划目录有严格的规则限制，禁止任何代码修改，只允许做规划。他手动在两者之间同步代码变更。

有开发者建议他试试git worktrees，Bob大叔欣然采纳了这个建议。

关于成本和工具选择，他目前使用每月100美元的订阅计划，暂时够用，但随着生产力提升，预计很快会不够。他用IntelliJ查看代码、自己跑编译和测试来确保Claude没有偷工减料，但代码修改完全交给Claude。IntelliJ的大部分功能其实都没用上。

两个Claude之间并不知道彼此的存在。Bob大叔会把规划者的方案推送给执行者，然后让执行者去实现。

当被问到如何写提示词时，他的回答很有启发性：不断迭代，让它总结理解的内容，回答它的问题，在计划成熟之前不让它动任何代码。这和带一个新人的方式完全一样。

代码质量方面，他会抽查并指导Claude清理发现的问题。只要持续关注，整体质量还是不错的。

这个工作流的精妙之处在于，它本质上是把整洁架构的思想应用到了AI协作中。规划上下文和实现上下文分离，两边都不会被污染。规划的Claude保持干净，不会被代码细节淹没，可以专注于更长远的思考。

社区里也有人分享了更进阶的玩法。有人建立了一个Claude委员会，每个Claude在独立目录下工作，通过文档进行沟通，只提供设计方案不提供代码，最终由专门的编码Claude执行。还有人用分支代替目录，规划Claude在规格分支上工作，编码Claude在功能分支上工作，把规格合并到PR中作为验收标准。

Bob大叔的这套方法论揭示了一个重要洞察：AI协作的本质是管理注意力和上下文。把执行和思考分开，让AI在各自的边界内发挥最大价值，同时保持人类对全局的掌控。手动同步虽然增加了一点摩擦，但这恰恰是一个强制审查的检查点。

这不仅仅是一个技巧，更是一种思维方式的转变。

13:55 · Jan 29, 2026 · Thu

谷歌的秘密武器：一次泄露揭开AI竞赛的真实战况 | 帖子

最近AI圈流传着一份颇为劲爆的泄露信息，关于谷歌内部代号“雪兔”的模型。这份泄露虽然真假难辨，但其中透露的技术方向，值得我们认真琢磨一番。

先说最抓眼球的数字：单次提示生成3000行可运行代码，直接构建完整应用。这意味着什么？过去我们用AI写代码，像是在跟一个聪明但记性不好的助手合作，写几十行就得停下来确认方向。而现在，AI开始具备“一口气把事情做完”的能力。

更有意思的是模型分工的思路。泄露信息显示谷歌在内部测试两个专门化模型：一个叫“猛隼”，专攻速度和逻辑推理；另一个叫“幽隼”，负责界面、视觉和音频创作。这种分而治之的策略，像极了人类团队的协作模式。

技术层面最值得关注的是“系统二思维”的引入。这个概念来自诺贝尔奖得主丹尼尔·卡尼曼的理论：系统一是快速直觉反应，系统二是慢速深度思考。泄露显示新模型配备了“深度思考”开关，在面对复杂逻辑问题时会主动暂停，先推理再作答。据称在高难度推理测试中拿到80%的分数，而竞品普遍在55%左右徘徊。

当然，泄露信息需要打个问号。有网友指出，这份泄露最初出现时GPT 5.2尚未发布，所以“超越未发布的GPT 5.2”这个说法本身就暴露了时间线。也有人认为这可能是Gemini 3 Pro的正式版，而非3.5版本。

但抛开具体数字不谈，这份泄露折射出的行业趋势是真实的：AI正在从“对话助手”进化为“全栈工程师”。有评论说得好，如果这些信息哪怕只有一半是真的，当前的发展速度就已经相当惊人了。应用级别的代码生成加上真正的推理能力，这个组合的威力不容小觑。

不过也有清醒的声音提醒：谷歌的产品往往是“一周热度，然后被遗忘”。技术实力是一回事，产品运营和市场推广是另一回事。谷歌确实提供了大量免费服务，但在用户心智的争夺上，似乎总是慢半拍。

有人说谷歌像一艘巨轮，你永远不知道它真正的实力。这话有道理，但巨轮的问题恰恰在于转向太慢。在这场AI竞赛中，速度和灵活性同样重要。

最终还是那句话：泄露归泄露，实际表现才是硬道理。如果真实使用效果不佳，再漂亮的跑分也撑不过一周。

13:52 · Jan 29, 2026 · Thu

WooYun Legacy：八万个真实漏洞，能教会AI什么

有人把乌云网2010到2016年间收录的88636个真实漏洞案例，整理成了一个Claude Code的技能包。装上之后，AI就能像资深安全专家一样思考问题。

这个数字值得细品。将近九万个漏洞，意味着九万次真实的攻防对抗，九万个血淋淋的教训。

知识库的规模相当可观，86MB的数据量，大约200万行内容，覆盖15种漏洞类型。从分布来看，SQL注入占了27%，命令执行19%，XSS跨站脚本11%，未授权访问和弱口令各占8%。

这组数据本身就是一份珍贵的行业切片。它告诉我们，在那个年代，最常见的安全问题是什么，攻击者最喜欢从哪里下手。

有句话说得好，历史不会重复，但会押韵。今天的安全问题换了马甲，底层逻辑往往还是那些老问题。

这个项目真正有价值的地方在于，它把散落的经验变成了可复用的知识。过去，一个安全工程师要成长，得靠师傅带，靠自己踩坑，靠在实战中慢慢积累。现在，这些经验可以被结构化、被传承、被AI学习。

当然，项目方也特别强调，这些知识仅供安全研究、教育培训和授权测试使用。技术本身是中性的，关键看握在谁手里，用在什么地方。

项目最后写了一句话，致敬乌云和那个时代的白帽子们。

确实值得致敬。那是中国互联网安全的黄金年代，一群理想主义者用自己的方式守护着网络世界。他们留下的不只是漏洞报告，更是一种精神遗产。

现在，这份遗产有了新的载体。

13:47 · Jan 29, 2026 · Thu

让AI从“聪明实习生”变成“500美元时薪顾问”的秘密 | 帖子

你有没有这样的经历：让AI扮演专家，结果得到的回答泛泛而谈，像极了刚入职的实习生在敷衍你？

问题出在哪？一位提示词研究者做了个有意思的实验。他在Claude、GPT-4和Gemini上测试了47种不同的角色设定，发现了一个惊人的差距：模糊的角色设定只能达到60%的输出质量，而精确的角色设定能飙升到94%。

这34个百分点的差距，藏着什么门道？

先看看大多数人怎么写提示词的：“请扮演一位营销专家，帮我策划一个活动。”

这句话的问题在于，AI完全不知道你要的是哪种专家。是做B端还是C端？数字营销还是传统营销？服务初创公司还是大企业？靠数据驱动还是创意优先？

信息模糊进去，答案自然模糊出来。

那什么才是有效的角色设定？这位研究者总结出五个核心要素：

第一，明确角色和资历层级。别说“扮演一个开发者”，要说“扮演一位专注分布式系统8年的高级后端工程师”。资历层级会改变决策模式，一个初级工程师和一个技术总监，思考问题的方式完全不同。

第二，给出行业和领域背景。同样是产品经理，做消费品的想的是病毒式增长，做企业服务的想的是合规和安全。不同的土壤，长出不同的果实。

第三，指定使用的方法论。“帮我分析数据”太空泛，“用JTBD框架做用户研究，用多变量测试验证，呈现95%置信度的统计结果”才是专家的思维方式。没有框架，分析就是随机漫步；有了框架，洞察才有章法。

第四，设定约束条件。这是最容易被忽略却最关键的一环。加上“预算5万美元，周期6周，团队只有3个初级开发者，优先交付而非完美”这样的限制，AI才会给出现实世界里真正能落地的方案。没有约束的建议，往往是正确的废话。

第五，规定输出格式。专家不仅思考方式不同，表达方式也有讲究。别说“给我你的分析”，要说“提供一份两页的高管简报，包含现状评估、三个战略选项及其利弊、推荐路径和成功指标”。格式本身就是专业度的信号。

这五个要素组合起来，就是一个完整的角色模板：你是一位在某行业有多少年经验的某职位，专长是什么，使用什么方法论，面临什么约束，需要交付什么格式的成果。

研究者还发现一个提升准确率的妙招：加一句“如果信息不足以给出完整答案，请先提出澄清问题”。这一句话让准确率从78%跳到了96%。道理很简单，真正的专家会追问，只有半吊子才假装什么都懂。

最后分享三个常见的坑：角色太模糊，“专家”两个字等于什么都没说；角色太多，让AI同时扮演开发者、营销人和设计师，结果哪个都不像；约束自相矛盾，“你是个创业者但预算无限”，这种设定会让AI的输出脱离现实。

一个清晰的角色，胜过一群模糊的专家。

建议你花点时间，针对自己常用的场景，建立一个角色库。每个角色花15分钟配置好，以后直接复制粘贴微调即可。这个小投入，能让你和AI的对话质量发生质变。

15:30 · Jan 27, 2026 · Tue

那些让你惊叹的AI Agent，99%都是假的 | 帖子

最近Google放出了一份64页的内部技术手册，直接戳破了AI Agent领域最大的泡沫。

当整个科技圈都在吹捧“自主AI员工”的时候，真相是：你上周看到的那个创业公司演示的Agent，本质上就是几个API调用加上漂亮的提示词。这根本不是Agent，只是昂贵的ChatGPT外壳。

Google提出了一个新概念叫“AgentOps”，类似于机器学习领域的MLOps，但专门针对Agent。包括评估框架、监控面板、CI/CD流水线、基础设施配置。和“拼几个提示词就上线”完全是两个世界。

真正的Agent需要通过四层评估检验：

第一层是组件检查，看它是否每次都能调用正确的API。第二层是逻辑检查，看你能否追溯它的推理过程。第三层是质量检查，看输出结果是否真的有效。第四层是安全检查，看它能否被越狱攻击。

现实是，大多数Agent连第一层都过不了。

安全问题更值得警惕。当你给Agent数据库访问权限时，你实际上是把整个公司的钥匙交给了它。提示词注入、数据泄露、静默失败，这些风险被大多数团队当作事后才考虑的问题。

演示和生产环境的差距是巨大的。演示在沙盒里运行，输入完美可控。生产环境面对的是边缘情况、愤怒的用户、凌晨三点宕机的系统。

那个在圈内传开的47000美元失控循环事故就是血淋淋的教训。Token爆炸、静默递归、零监控，这就是没有监控就部署的代价。

演示优化的是惊艳效果，生产优化的是可靠性。这两者之间隔着一条鸿沟。

Google押注的是基础设施，而不是噱头。当创业公司还在烧钱做Agent玩具的时候，Google正在铺设所有人最终都需要的轨道。

如果你在构建Agent时没有评估框架、没有监控、没有可靠性设计模式，那你构建的就不是Agent。

Agent经济不会真正到来，直到我们停止把这件事当作提示词工程来对待。最先想明白这一点的公司，将主导下一个十年。

16:03 · Jan 26, 2026 · Mon

以前发过这东西，又好像没发过 | 殆知阁

这个网站的作者好像不更新了(?)，地址有时候会换或者打不开

15:59 · Jan 26, 2026 · Mon

一个自动下载媒体素材的skill：智能媒体下载器 | #工具

根据你的描述自动搜索和下载图片、视频片段，支持视频自动剪辑。配合其他skill可以实现自动生成视频等功能。

工具

15:45 · Jan 26, 2026 · Mon

从零构建一个微型vLLM：深入探究大语言模型推理优化 | github

这篇文章用“从零做一个迷你 vLLM”的方式，解释高性能大模型推理引擎在工程上到底优化了什么。作者实现了一个教学向的最小版本 nano-vllm，把 vLLM 常见的关键技术拆开讲清楚，并给出模块化代码结构，方便读者对照理解。

15:39 · Jan 26, 2026 · Mon

Anthropic黑客马拉松冠军开源了他的全套Claude Code配置 | 开源地址

Claude Code发布快一年了，很多人还在摸索怎么用好它。最近Affaan开源了一个非常实用的配置合集，他是Anthropic黑客马拉松的冠军得主，用Claude Code从零构建了zenith.chat这个产品。

这套配置是他10个多月密集使用的结晶，包含了生产级别的agents、skills、hooks、commands和MCP配置。

先说几个有价值的部分：

关于Token优化，很多人不知道同时启用太多MCP会严重压缩上下文窗口。200k的窗口可能直接缩水到70k。他给的建议是配置二三十个MCP，但每个项目只启用不超过10个，保持工具数量在80以下。

关于Memory Persistence，这是一个非常聪明的设计。通过hooks在session开始时自动加载上下文，结束时自动保存状态。这解决了Claude Code会话之间记忆断裂的问题。

他设计了一套完整的Agents体系，每个都有明确的职责边界：planner负责规划，architect负责架构决策，code-reviewer做质量审查，还有专门的安全审查、构建错误修复、端到端测试等等。这种分工让Claude Code的输出更加专业和可控。

Skills部分覆盖了前后端开发的主要模式，包括React和Next.js的最佳实践、API设计、数据库和缓存模式、TDD工作流等。还有一个continuous-learning的skill，可以从session中自动提取模式形成可复用的知识。

Hooks的设计也很巧妙。比如有一个hook会在你编辑代码时自动检测console.log并发出警告。这种小细节能帮助养成更好的编码习惯。

安装方式很灵活，可以作为plugin一键安装，也可以手动复制需要的组件。他还贴心地把所有脚本用Node.js重写了，全面支持Windows、macOS和Linux。

最后他强调了一点：这些配置是他个人工作流的产物。建议从你认同的部分开始，根据自己的技术栈调整，删掉不需要的，加入自己的模式。

15:37 · Jan 26, 2026 · Mon

2026届应届生系统设计路线图：8周从零到面试就绪 | 文章

系统设计正在成为区分工程师和程序员的分水岭。对于即将踏入职场的应届生来说，这已经不再是可选项，而是必修课。

首先说清楚什么是系统设计。简单理解，写代码是给一个小程序写指令，而系统设计是规划如何让数百万用户流畅、可靠、快速地使用你的应用，即便某个部分出了故障也能正常运转。它像给一栋大楼画蓝图，你需要决定系统需要哪些组件、这些组件如何连接和通信、如何应对海量用户和服务器崩溃等现实挑战。

为什么应届生必须学这个？Google、Amazon这类产品公司在校招时已经开始考察系统设计，他们想看到你能进行全局思考，而不仅仅是写出局部代码。就连TCS、Infosys这类服务型公司，现在也会问一些基础的低层设计或简单的扩展性问题。好消息是，应届生面对的题目通常比较简单，比如设计短链接服务、停车场系统、限流器、电梯或基础的社交媒体动态，不会让你设计整个Netflix后端。面试官关注的是你的逻辑思维能力、做权衡的能力以及清晰表达想法的能力。

系统设计分两大类。高层设计关注宏观架构，描述主要组件如何连接；低层设计关注细节实现，包括类、方法和设计模式。以WhatsApp为例，高层设计考虑用户发消息到API服务器再到消息队列最后送达朋友手机的完整链路，低层设计则考虑如何设计Chat类以及它的发送和接收方法。

掌握正确的思维方式至关重要。系统设计没有标准答案，面试官真正在意的是你的推理过程和权衡取舍。每次设计都应该遵循这个流程：澄清需求、估算规模、画出高层架构、深入细节、讨论权衡。画图是成功的一半，建议使用Draw.io或Excalidraw这类免费工具。

接下来是8周学习计划。第一周掌握基础概念和面试方法论，理解功能性需求与非功能性需求的区别，搞懂CAP定理，银行系统偏向一致性，社交媒体偏向可用性。第二周学习扩展性和网络基础，包括水平扩展与垂直扩展、负载均衡、CDN等。第三周深入数据库存储，理解SQL和NoSQL各自的适用场景、ACID与BASE的区别、分片和复制策略。第四周攻克缓存和消息队列，掌握不同缓存策略以及Kafka、RabbitMQ的基本用法。第五周学习API设计和微服务架构，了解REST、gRPC、GraphQL的差异，关注AI和大语言模型API集成这类新趋势。第六周专注低层设计，牢记SOLID原则，练习停车场、电梯、图书馆等经典题目。第七周学习高可用模式和监控，包括熔断器、重试机制以及Kubernetes基础。第八周进入实战演练，练习URL短链接、限流器、社交媒体时间线等经典问题，配合模拟面试。

几个实用建议。每天投入4到6小时，自己动手画架构图，录制自己讲解设计的过程控制在45分钟内，在GitHub上实现3到5个设计方案形成作品集，争取完成8到10次模拟面试。亚马逊面试偏重低层设计，Google偏重高层设计基础，校招外的社招高峰期通常在2月到5月。

学习资源方面，Gaurav Sen的YouTube播放列表非常适合入门，GitHub上的system-design-primer项目涵盖了所有核心概念，GeeksforGeeks和roadmap.sh提供了清晰的知识图谱。

系统设计的核心不在于背诵标准答案，而在于理解权衡并像工程师一样思考问题。

15:33 · Jan 26, 2026 · Mon

Claude写代码很强，但有个致命短板 | 帖子

Claude在编程方面确实非常出色，跟普通大模型相比简直是降维打击。但有一个问题值得所有使用者注意：它是“近视眼”。

因为它从来看不到完整的代码全貌，只能通过grep搜索找到相关代码片段。一旦grep返回了跟bug描述相似的代码片段，它往往就不再深入探索了，直接在不相关的地方“修复”问题，或者基于这些碎片化的信息来回答问题。

随着代码库不断膨胀，这个问题会越来越严重。如果使用者自己不了解代码结构，Claude就会不断重复造轮子，在应用的不同位置为相同功能创建重复实现。

有个真实案例很能说明问题：有人让Claude给一个按钮添加键盘快捷键，结果它复制了整个处理逻辑而不是调用已有的按钮处理函数。后来修改功能时，按钮和快捷键的行为就出现了不一致。

社区里已经有不少人在探索解决方案：

第一种是让Claude先绘制代码架构地图，包括主要子系统、职责划分、共享服务、容易重复的区域等，然后要求它每次操作前都参考这张地图并持续更新。

第二种是用CLAUDE.md文件预先定义项目结构、关键模式、哪些东西不能重复实现。

第三种是建立完整的文档体系，用Mermaid图表展示整个应用的连接关系，在每个主要模块下都放置readme文件，再配合文档更新工具来维护。

还有开发者分享了自己的做法：定期安排“停下来清理”的时间，专门检查文档、更新文档、合并重复代码。

有人提出了一个更根本的观察：这不仅仅是上下文窗口的问题，模型本身就被训练成“找到相关内容就停止搜索”的行为模式。

这个讨论揭示了一个重要认知：AI写代码很强，但绝不意味着人可以完全放手。架构思维和全局视野仍然需要人来把控。代码库越大，使用者对整体结构的理解就越关键。

说到底，当前最有效的方法还是建立一套外部记忆系统，让模型在每个重要步骤都能参考和更新，弥补它在长期记忆上的不足。

15:29 · Jan 26, 2026 · Mon

如何真正读懂一篇研究论文 | 帖子

研究论文不是教科书，它们是面向专家的压缩论证。如果你像读博客一样去读论文，几乎必然会误解其中的内容。

首先要搞清楚一篇论文究竟在做什么。大多数论文无非是以下四类之一：更精确地定义问题、提出新方法、分析现有方案的失败或局限、对已有方法做增量改进。真正具有革命性的论文少之又少。如果你总期待看到颠覆性突破，反而会错过论文真正的贡献。

读论文的正确姿势是打乱顺序读。线性阅读效率太低。建议按这个顺序：摘要看论点和范围，图表看实际变化，结论看作者认为什么重要，引言看背景和框架，方法部分放到最后。这样做是为了在接触细节之前先搭建好心智框架。

尽早识别核心贡献。问自己一个问题：相比前人的工作，这篇论文改变了什么？可能是一个新假设、一个新目标、一种简化方案，或者一个更好的权衡取舍。如果你没法用一句话说清楚这个变化，就继续读，直到能说清楚为止。

要把假设和结果分开看。大多数论文之所以有效，是因为它们建立在特定假设之上。仔细寻找数据条件、简化处理、约束条件和理想化模型，然后问自己：这东西离开实验室还能用吗？这一步能避免盲目照搬。

把公式当作契约来读。公式定义了研究与现实之间的约定。对于每个关键公式，搞清楚每个项代表什么、忽略了什么、如果这个项出错会导致什么问题。不需要推导每一步，但要推导那条关键路径。

带着怀疑的眼光读实验部分。图表很有说服力，但细节才重要。检查基线设置、选择的指标、超参数配置和失败案例。没有展示失败案例本身就是一个信号。

把论文纳入你的知识图谱。一篇论文应该能连接到你已经知道的东西上。明确地把它和之前的方法、已知的局限性、其他表述方式、其他领域关联起来。孤立的理解会很快遗忘。

在合适的时候果断停止阅读。不是每篇论文都需要完全理解。当你已经理解了核心想法、知道它的位置、知道它什么时候会失效，就可以停下来了。深度理解可以等到真正需要的时候再来。

把阅读转化为输出。单纯的阅读是被动的。做以下任意一件事：用简单的话重新表述想法、画出算法草图、实现一个简化版本、向别人解释一遍。输出会揭示你到底理解了多少。

最后一条原则：不要问自己“我理解这篇论文了吗”，而是问“我能解释它为什么有效、什么时候会失败、我会不会用它吗”。

能回答这个问题，才算真正读懂了。

15:29 · Jan 25, 2026 · Sun

先睡了，太困了

14:20 · Jan 25, 2026 · Sun

Everything Claude Code：一个由 Anthropic 黑客松获奖者创建的 Claude Code 配置全集，经过 10 多个月的高强度日常使用，专为构建真实产品而优化，包含生产级可用的智能体（agents）、技能（skills）、钩子（hooks）、命令、规则和 MCP 配置。

16:00 · Jan 24, 2026 · Sat

Technovelgy，一个考据网站

记录了超过2000个科幻创意和发明创造以及超过4300种科幻作品系列的基本资料，将不同类型科幻概念的作品按字母和时间分类汇总，也就是说大家可以用它来查询某一个科幻概念最早出现在什么作品里，有些还挺让人意外的。