黑洞资源笔记

16:00 · Feb 13, 2026 · Fri

谷歌悄悄放出数学怪兽，但你永远用不上 | 帖子

谷歌低调发布了一个叫 Aletheia 的数学专用模型，在国际数学奥林匹克竞赛基准测试上拿了满分，把所有竞争对手远远甩在身后。榜单上第二名 GPT-5.2 Thinking 只有35.7%，而 Aletheia 高达91.9%。

这名字起得很有意思。Aletheia 是古希腊哲学中「真理」的意思，但比字面含义更深一层，指的是「去蔽」，让隐藏的东西显现出来。一个数学模型叫这个名字，暗示它不是在编造答案，而是在揭示事物本来的面目。

更值得关注的是谷歌同步发布的论文。Aletheia 在解决问题时展现出了跨领域建立联系的能力，比如用几何分析中的概率测度紧致性来设计近似算法，或者发现 Kirszbraun 扩展定理与 Steiner 树计算之间此前从未被注意到的关联。这些不是简单的模式匹配，而是接近真正的数学发现。

但社区的反应很分裂。

一派认为这是里程碑式的进展。如果模型能够产生非平凡的数学洞见，科学发现的加速可能比我们想象的更近。有人说得好：即使所有能力提升今天就停止，我们也需要十年才能消化已经取得的进展。

另一派则相当冷淡：不开放公众使用，不关心。这话听起来刺耳，但指向一个真实的问题。Aletheia 本质上是一个生成器加验证器的智能体系统，配合大量脚手架工程和微调，运行成本极高。它和榜单上其他纯语言模型根本不是同一类东西，就像拿 AlphaGo 和普通棋手比赛然后宣布 AlphaGo 更聪明一样。

这里藏着一个更深的问题：你真的相信未来能用上最先进的模型吗？事实上，今天你已经用不上了。

最前沿的能力正在变成一种基础设施，而非消费品。它们会被用来加速科学研究、优化算法、推动发现，但普通用户能触及的，永远是经过层层稀释的版本。这不是阴谋，只是经济学。

谷歌擅长把东西藏起来，直到某个创业公司做出差不多的产品逼他们出手。Aletheia 大概也会走这条路。

15:54 · Feb 13, 2026 · Fri

斯坦福学生的学习秘诀：让AI像教授一样思考 | 帖子

大多数人用 NotebookLM 的方式是：上传 PDF，问几个基础问题，得到摘要。这和用搜索引擎没什么本质区别。

但斯坦福的顶尖学生玩法完全不同。

他们上传课堂笔记后，第一个问题是：“根据这份材料，最可能出现的三道考试题是什么？”

然后追问：“把这些概念和上周的阅读材料串联起来，生成一份学习指南。”

最后：“设计几道综合题，把今天的内容和之前的作业结合起来。”

这套流程的本质是什么？不是让 AI 帮你复习，而是让它扮演你的教授。

有人把这个方法论拆解得很透彻：普通学生把 NotebookLM 当检索工具，顶尖学生把它当预测引擎。

第一步“预测考题”，本质是强迫模型把材料映射到评估目标上，大幅缩小学习范围。第二步“跨周串联”，是在建立因果结构，孤立的记忆只会制造噪音，关联才能暴露盲点。第三步“生成练习题”，形成闭环：生成、测试、纠错。

学生不再是信息的消费者，而是在不断迭代反馈循环。

这就是为什么原本六小时的交叉引用工作，十五分钟就能完成。你在考试前就开始消除不确定性，而不是等到考完才知道自己哪里不会。

当然，这套方法有个风险：虚假的信心。

AI 是根据上下文推断模式，不是根据真实的评分标准。如果不和往年真题、教学大纲交叉验证，你可能只是在优化模型的猜测，而非现实。

正确的用法是把 NotebookLM 当作“观察放大器”，而非权威。上传笔记、生成预测、用真实材料验证、再迭代。

有医学院学生说，这根本不是什么秘密，他们早就这么干了。也有工程系学生泼冷水：对于那些考题和课堂内容完全脱节的硬核课程，这招不灵。

最有意思的批评来自一位教育者：这些学生学会的是如何破解考试，而不是真正理解知识为什么存在这样的关联。长期来看，这是一种贫瘠的学习方式。

但话说回来，考试本身测试的就是关联能力，而非单纯记忆。掌握 AI 辅助的模式识别的学生，会跑赢那些只会死记硬背的人。

学习的本质正在改变：从被动吸收，变成持续的预测与纠错循环。

15:51 · Feb 13, 2026 · Fri

有人在Reddit、X和各种研究社区里收集了所有爆火的NotebookLM提示词。核心发现：所有病毒式传播的提示词都有共同模式。要求引用具体原文，追问矛盾而非摘要，强制承认知识盲区，规定结构化输出格式。NotebookLM的真正威力在于它的"锚定架构"，你越懂得利用这一点，它就越强大。| 帖子

以下是16个可以拿来就用的提示词：

一、提取核心问题

"分析所有输入内容，生成5个关键问题，回答这些问题就能抓住所有材料的核心要点。"Reddit用户称之为"改变游戏规则"的方法。它迫使AI提取有教学价值的结构，而非肤浅的摘要。

二、讲座笔记专用

在上述基础上聚焦：核心主题与定义、重点强调的概念、概念间的关系、提到的实际应用。

三、"有趣之处"提示词

NotebookLM的产品总监Steven Johnson用这个提示词处理了50万字的NASA访谈记录，20秒完成了10小时的手工活："这些资料中最令人惊讶或有趣的信息是什么？请附上关键引文。"传统搜索能找到相关性，但找不到"有趣性"。

四、定向挖掘版

"我想写关于某主题的文章。这些资料中与该主题相关的最令人惊讶的事实或想法是什么？请附上关键引文。聚焦某具体方面，忽略其他方面。"

五、问答节目格式

让AI主持人互相出题，故意答错让纠正过程加深记忆。学生们特别喜欢这个。

六、多语言播客

在官方语言支持出现之前，用户就用这招生成西班牙语、德语、日语播客："这是Deep Dive的首期国际特别节目，全程使用某语言。除非需要解释专有术语，否则不使用英语。"

七、产品经理视角

把文档变成决策备忘录，聚焦用户证据、可行性检查、盲区分析。

八、科研助理视角

为需要方法论而非结论的学者设计，聚焦样本量、实验设计、统计显著性，而非泛泛的结论。

九、中学教师视角

把复杂内容变得易懂：一句话总结、现实世界类比、三个难词的简单定义。

十、文献综述主题提取

识别5到10个最常出现的主题，说明每个主题在哪些论文中出现、如何被处理（争论、假设还是验证）。

十一、矛盾发现器

找出资料间的分歧，引用双方具体观点，分析分歧原因（方法、样本还是语境），指出什么证据能解决争议。

十二、差距分析

当你尝试某事但失败时使用。交叉对照你的做法与上传资料，找出你没遵循的方法论、完全遗漏的概念、跳过的前置条件。

十三、概念落地

把研究转化为行动步骤，每个要点都锚定具体引文，承认知识盲区。

十四、概念联结

发现想法之间不明显的联系，"综合某主题1和某主题2之间的联系，无论多抽象。"

十五、全面主题分析

最大长度、深度研究的输出。规划要探索的关键方面，区分事实与解读，用证据支撑观点。

十六、辩论格式

当你的资料本身存在分歧时使用。让两位主持人就某主题进行辩论，互相质疑，引用具体证据，让听众自己判断谁更有说服力。

这些提示词的共同智慧是：不要问AI"这是什么"，要问"这里面有什么矛盾"、"我漏掉了什么"、"最反直觉的发现是什么"。好问题比好答案更稀缺。

15:49 · Feb 13, 2026 · Fri

让 Claude Code 真正好用的六个插件 | 帖子 | #插件

用 AI 写代码最怕什么？能跑但丑，能用但乱，声称没问题结果一堆 bug。这几个插件专治这些毛病。

1. Superpowers：大项目必备。它会启动子代理做调研，先想清楚再动手。内置 TDD 和系统化调试流程，防止 Claude 写完就说"搞定了"然后一运行全是错。

2. Frontend Design：让 Claude 真正在意视觉。生成的组件不再是千篇一律的模板脸，字体、间距、配色都会有意识地打磨。做落地页和仪表盘的时候特别有用。

3. Code Simplifier：功能跑通之后用它清理代码。专门针对最近改动的文件，把 Claude 写出来那些"能用但看着难受"的代码收拾干净。

4. Playground：一行命令生成独立的 HTML 工具，数据可视化、设计探索器、概念图都行。单文件，零依赖，浏览器打开直接用。

5. Claude in Chrome：让 Claude 能看到浏览器、点按钮、填表单。调试线上页面、抓数据、自动化重复操作，直接用你登录好的会话，不用单独处理认证。

6. PR Review Toolkit：一组专门的代码审查代理，分别负责测试覆盖率、错误处理、类型设计、代码质量。每个代理只管一件事，比单次审查更彻底。

一个进阶玩法：让 Claude 和 Codex 互相审查对方的代码，交叉检验能发现不少问题。

工具的价值在于组合。规划用 Superpowers，界面用 Frontend Design，完成后用 PR Review。先把一个用熟，再叠加下一个，最终你会开始写自己的插件。

插件

15:46 · Feb 13, 2026 · Fri

AI研究员的提示词工具箱：哪些真有用，哪些是玄学 | 帖子

有人声称采访了12位来自OpenAI、Anthropic和Google的AI研究员，总结出他们共同使用的10个提示词。这份清单在社交媒体上广泛传播，但真正有意思的是评论区里一位用户让Claude自己评价这些技巧，得到了一份相当诚实的答案。

先说确实有效的几个：

「展示推理过程」和「思考预算」本质上是同一件事：强迫模型把思维链条外化。这在数学、逻辑和复杂分析任务上效果显著，有大量研究支撑。给模型更多token去思考，确实能换来更好的推理质量。

「验证链」要求模型先回答问题，再列出可能出错的地方，最后自我修正。这种内置的自我纠错机制真的能抓住模型原本会自信地犯下的错误。

「对抗性质询」让模型反驳自己的答案，是避免AI变成你观点回音壁的最佳方式之一。模型天生过度自信，这个技巧强迫它保持智识上的诚实。

「边缘案例猎手」在代码审查和系统设计中特别有用，能暴露模型的盲点。

再说效果因场景而异的：

「约束强制」确实能让输出更简洁，「不要使用模糊语言」这个指令在去除废话方面出奇有效。「比较协议」在你指定比较维度时效果更好，否则模型会挑自己方便的角度。

「不确定性量化」可以做，但说实话，模型给出的置信度数字更多是一种「感觉」，没有经过校准。当作方向性参考就好，别太当真。

最后是被高估的：

「专家角色扮演」，那种「你是一位有15年经验的资深专家」的写法，大部分是表演。模型要么懂这个领域，要么不懂，角色设定可能稍微改变语气，但不会解锁什么隐藏知识。

「格式锁定」要求输出JSON格式，这只是正确使用工具的方式，算不上什么秘密技巧。

真正的元教训是：最有效的提示词都在做同一件事，给模型提供结构和约束。清晰的预期带来清晰的输出，这和一个好老板给出清晰需求是一个道理。

这些技巧本身都是实用的沟通原则，只是被包装成了「研究员内部秘密」来获取流量。没有什么隐藏的研究员知识，有的只是好的沟通方式。

01:18 · Feb 12, 2026 · Thu

据俄媒 RBC 报道，俄罗斯国家通讯监管机构Roskomnadzor reportedly已开始对加密通讯应用Telegram实施降速并限制访问，理由是Telegram在打击诈骗和犯罪活动方面措施不力。

Roskomnadzor去年8 月曾部分封锁Telegram和WhatsApp的语音通话功能，称这两款应用被用于勒索和“恐怖主义活动”。同一时期，俄罗斯还要求手机和平板厂商在在俄销售的新设备中预装国家主导的 Max 即时通讯应用，以推动本土替代方案的普及。

——cnbeta

01:06 · Feb 12, 2026 · Thu

迅雷旗下公司推出「光鸭云盘」，号称免登录下载和支持三方应用连接。可以通过播放器直连云盘并刮削数据搭建自己的影视库以及 4K 分辨率播放。

光鸭云盘看起来主要是对标阿里云盘，后者支持三方应用连接直接播放内容，但矛盾在于直接播放内容需要大量带宽，所以阿里云盘现在对此类使用需求收费，估计光鸭云盘也无法避免此类问题。

光鸭云盘具有如下特点：

-小型文件免登录快速下载，对于 100MB 以下的分享文件不需要登录即可下载
-为用户提供更大的空间，用户注册后即可获得 2TB 空间，最高支持 500TB 空间
-支持多种云下载协议，包括普通链接、磁力链接、ED2K 以及种子解析等
-最高支持上传高达 100GB 的单文件，满足部分用户需要上传超大文件的痛点
-提供 API 允许第三方应用对接，例如播放器类应用可以直连并支持海报刮削等
-支持原画无损播放，最高可以支持 4K 分辨率播放且支持最高五倍速播放

——蓝点网

16:27 · Feb 10, 2026 · Tue

一份值得收藏的AI社区导航手册 | 帖子

在信息爆炸的时代，找到高质量的学习社区比掌握任何单一技能都重要。Reddit用户JensPetrus花了大量时间整理了一份AI相关子版块的完整清单，覆盖了从大语言模型到图像生成、从自动化工作流到AI编程的几乎所有领域。

这份清单的价值在于它的筛选标准：活跃度高、有教育意义或能带来灵感启发。

通用AI讨论区包括ArtificialIntelligence、PromptEngineering、GenerativeAI等，适合了解行业动态和交流使用心得。AIToolTesting专门分享各类工具的实测体验，是发现新工具的好去处。

大语言模型板块最为丰富。ChatGPT相关的就有好几个：ChatGPT是最大的综合社区，ChatGPTPro面向专业用户分享工作流和进阶技巧，ChatGPTPromptGenius则专注于提示词优化。此外还有OpenAI、Anthropic、ClaudeAI、GeminiAI、PerplexityAI、DeepSeek、Grok、MistralAI、QwenAI、LocalLLaMA等，几乎覆盖了市面上所有主流模型。

图像和视频生成领域同样热闹。Midjourney和StableDiffusion是两个最大的图像生成社区，Veo3专门展示谷歌视频生成器的作品，KlingAIVideos和HiggsfieldAI则聚焦其他视频工具。

AI音乐创作以SunoAI为主阵地，这是目前最受欢迎的AI音乐平台。UdioMusic因为下载限制，热度已经下降不少。

AI写作社区相对小众但很专注，WritingWithAI是最大的一个，BookwritingAI则专门讨论用AI写书。

AI编程是当下最火的应用场景之一。VibeCoding和ClaudeCode是两个最大的社区，ChatGPTCoding专注于用ChatGPT写代码，Cursor则围绕这款热门AI编程工具展开讨论。OnlyAIcoding特别适合没有编程基础的人，大家在这里分享策略和提示词。

工作自动化方面，n8n和Zapier是两个主流平台的官方社区，AI_Agents专门讨论能自主执行任务的智能代理。

研究导向的社区包括MachineLearning这个2009年就创建的老牌版块，以及关注技术奇点的Singularity。

有用户建议创建一个多版块聚合订阅，这样可以一次性关注所有相关内容。已经有人做好了现成的聚合链接，感兴趣的可以去原帖查看。

学习AI最高效的方式，是把自己放进一个持续产出高质量内容的信息环境里。这份清单就是一张入场券。

16:22 · Feb 10, 2026 · Tue

当AI开始自动给你的代码库提PR，我们该担心什么 | 文档

GitHub刚刚发布了一个野心勃勃的新项目：Agentic Workflows。设想一下，每天早上你打开电脑，发现代码库里已经躺着几个自动生成的PR，文档更新了，测试覆盖率提高了，CI失败被自动分析了，Issue也被自动分类了。听起来很美好，对吧？

这套系统的核心思路是把AI编程代理塞进GitHub Actions里，用Markdown文件定义任务，然后让Copilot、Claude或Codex这些模型去执行。官方强调了安全设计：默认只读权限、沙箱执行、网络隔离、工具白名单。

但社区的反应相当精彩。

有人挖出了一个真实案例：Dependabot创建了一个版本升级的Issue，AI代理接手后，没有用正确的go get命令，而是直接在go.mod里加了一个replace语句。这根本不是正确的做法。更离谱的是，PR里还混入了一些无关的改动，AI审查员指出了问题，但人类维护者没注意就直接合并了。

这暴露了一个根本性问题：AI代理并没有真正理解它在做什么，它只是在模式匹配字符串，然后生成看起来正确的新字符串。

类似的问题在npm的package.json里也很常见。代理不会用npm install命令，而是直接编辑JSON文件，然后幻觉出一个版本号。重命名变量时更糟糕，代理不会用IDE的重构工具，而是暴力用字符串替换，然后编译、看报错、再改，烧掉大量算力。

有开发者分享了应对策略：在提示词里明确写上「添加依赖时用cargo add，不要指定版本」，问题就消失了。但这治标不治本，当上下文窗口变长，模型遵循指令的能力会下降。

更深层的担忧是：执行安全和决策验证是两回事。权限控制解决的是代理能做什么，但真正的失败往往来自代理在权限范围内做了错误的事情，而且信心满满。

还有人吐槽GitHub的优先级问题。Actions的核心功能还有一堆bug没修，付费用户遇到问题一年了还没解决，现在却在往上面堆AI功能。有开源维护者直言：我交的钱被拿去搞AI噱头，而不是改进核心产品，这让我很恼火。

域名选择也引发了争议。官方用的是github.github.io而不是github.com，这违反了人们被教导的防钓鱼规则。GitHub自己说过github.io是用户生成内容的域名，官方内容应该在github.com上。现在自己打脸，等于在训练用户忽视域名安全。

不过也有人看到了价值。把代理放在一个能访问CI、Issue和源码的中心化平台上，确实是个合理的位置。关键是要把AI调用和实际应用分开，这个架构思路是对的。

项目团队在评论区积极回应，承认这还是早期研究，欢迎反馈。他们修复了一些被指出的问题，包括那个go.mod的案例。

自动化本身其实不是问题，问题是我们还没有好的方法来验证AI的决策质量。代码不只是字符串，它承载着组织的知识。让AI慢慢改进代码库是个好想法，但前提是每一步都经过人类审视。否则，你得到的不是助手，而是一个需要你不断收拾烂摊子的实习生。

16:15 · Feb 10, 2026 · Tue

当所有人都在吹捧OpenClaw时，我决定读一遍它的源码 | 帖子

最近OpenClaw火得一塌糊涂，媒体铺天盖地的报道让我产生了怀疑。通常这种阵仗，背后往往是普通东西被包装得太好。

于是我花时间读完了它的开源代码。结论是：2%的常规技术，98%的营销泡沫。

核心功能其实就两件事：通过即时通讯软件和大语言模型聊天，以及让模型调用你电脑上的工具。这两样都不是什么新鲜玩意。

媒体吹嘘的"神奇浏览器操控能力"，根本不是OpenClaw的能力，而是微软Playwright库的能力。Playwright本身就是为程序化控制浏览器而生的，内置视觉模型能把屏幕内容转成文字描述。OpenClaw只是在中间传话而已。

典型工作流程是这样的：你说"帮我在亚马逊买个手电筒"，OpenClaw把消息扔给大模型，大模型决定用Playwright打开亚马逊，Playwright返回页面描述，大模型再决定搜索什么、点击什么。整个过程中，OpenClaw就像个跑腿的，模型说什么它做什么。

我翻遍源码，没找到其他值得一提的东西。所谓的"记忆系统"就是把对话存成文本文件，用grep搜索。

这是个不错的业余项目，但仅此而已。

然后评论区炸了。

有人说我漏掉了定时任务、多模型支持、统一网关、子代理协调这些功能。有人说Linux也只是GNU工具的"胶水代码"，iPhone也只是芯片和触摸屏的"胶水代码"，Uber也只是GPS和支付接口的"胶水代码"。

这个类比很有意思，但也恰恰说明了问题所在。

真正让我停下来思考的是几个真实用户的反馈。一位律师说他的代理两天内整理了海量法律模板，还能协调日程、做法律研究。一位数据分析师终于可以边散步边用语音指挥代理生成可视化图表，不用再被钉在显示器前。一位完全不懂技术的朋友正在用它实现做游戏的毕生梦想。

还有人用它学德语，把它当成超级智能的Anki卡片。有人让它每天早上自动生成一个新应用。有人用它管理整个智能家居。

我承认，把现有组件以正确的方式组合在一起，本身就是一种创造。苹果没有发明图形界面，但把它带给了普通人。

不过我依然认为，理解一个东西的技术本质和承认它的实用价值是两回事。OpenClaw的价值在于降低了门槛，让非技术用户也能调动这些能力。但这不改变它在技术层面确实没有原创性的事实。

集成工作很重要，但我们也不必把集成工作神话成技术突破。

16:12 · Feb 10, 2026 · Tue

你的照片正在出卖你的位置 | 帖子

最近一个叫GeoSpy的AI工具在社交媒体上引发热议。它号称能通过你发布的照片精准定位你的所在地。

这其实不是什么新技术。反向图片搜索、EXIF元数据提取、地理位置数据库早就存在多年。真正改变的是这些能力被包装成了傻瓜式界面，任何人都能上手。有评论者指出，那些GeoGuessr游戏高手比如Rainbolt，凭肉眼就能做到类似的事情。

但问题恰恰在这里。以前你要找到一个人的位置，需要真正的人类技能。现在这种能力被“民主化”了，门槛降到了地面。

真正的隐私风险不是工具本身，而是你照片里泄露的信息量远超你的想象。街道标识、建筑风格、植被特征、窗户倒影，交叉比对几张照片就能快速三角定位。更不用说很多人根本不知道自己的照片里还藏着GPS坐标。

有人分享了一个真实案例：乌拉圭一位检察官和妻子去哥伦比亚卡塔赫纳度假，毒贩通过他妻子发的Instagram照片追踪到他们，随后将他暗杀。

还有人提到那条古老的忠告：别在度假时发度假照，因为那等于告诉全世界你家现在没人。入室盗窃从未消失，瘾君子们也会刷社交媒体。

防护措施其实不复杂。不要实时发布位置信息，避免暴露日常动线规律，上传前手动清除元数据。更重要的是做好威胁建模，想清楚你真正需要防范的是谁。

目前GeoSpy已经限制了访问权限，只对企业和执法机构开放。这是好事也是讽刺。工具可以用来找回被绑架的儿童，也可以用来追踪前任。在这个问题上，善与恶之间只隔着一个用户协议。

有人评论说：想象一下军方和情报机构手里的工具是什么级别。

这大概是整个讨论中最清醒的一句话。

15:49 · Feb 10, 2026 · Tue

打开AI黑盒：让大模型的内部结构肉眼可见 | 帖子 | 项目地址 | 在线体验 | 经典参考

我们每天都在使用大语言模型，但它们内部究竟长什么样？一位开发者决定不再把模型当成黑盒来对待。

Reddit用户sultan_papagani开发了一个小工具，可以上传任意的gguf格式模型文件，用类似3D的方式可视化它的内部结构：层、神经元、连接关系，一目了然。开发者自嘲这只是个粗糙的原型，但社区反响热烈。

这个工具的核心价值在于：它让抽象的模型参数变成了可以旋转、缩放、漫游的空间结构。你可以用键盘在神经网络的层级间穿梭，看到每个权重的实际数值如何影响节点的颜色。有人评论说这像赛博朋克游戏里的黑客小游戏，某种程度上确实如此，只不过你破解的是人工智能的大脑。

技术实现上，它只读取gguf文件的头部信息，在浏览器端用纯HTML和JavaScript完成渲染，完全离线运行。这意味着你不需要把模型上传到任何服务器，隐私安全。

讨论中涌现出不少相关资源。有人提到Brendan Bycroft两年前做的LLM可视化项目堪称经典，但无法加载自定义模型。还有Neuronpedia这个开源项目，专注于模型可解释性研究，可以追踪特定概念在神经网络中的激活路径。另一位开发者曾经做过动态可视化，能显示模型推理时的激活模式，可惜账号已删除。

有用户提出了一个诱人的想法：能不能让可视化实时播放推理过程？想象坐在VR里，看着神经网络在处理每个token时逐层点亮，这对理解模型行为会有多大帮助。

AI发展飞速，但帮助人们理解AI的可视化工具严重滞后。理解你使用的工具，和盲目信任它，是两种完全不同的关系。