黑洞资源笔记

9 hours ago

突破80年数学难题！OpenAI推理模型改写离散几何研究史 | blog

OpenAI 的通用推理模型自主破解了存在 80 年之久的离散几何难题——单位距离问题。这不仅是 AI 首次独立解决数学领域的重大猜想，更通过跨学科的“降维打击”，证明了 AI 具备从现有知识中提取并建立全新逻辑连接的原创能力。

关于“LLM 只是在对训练数据进行插值”的论调，最近被一个数学事实扇了耳光。

大家常说 AI 没有创造力，只是在已有的知识凸包（Convex Hull）里做插值，也就是在已知点之间找过渡。但 OpenAI 的模型刚刚做了一件极其反直觉的事：它推翻了 Erdős 提出的单位距离问题猜想。这个猜想困扰了数学界 80 年，大家一直觉得“方格阵列”就是最优解，结果 AI 甩出了一个完全不同的构造方式。

有意思的是，这个解法不是靠暴力穷举，而是极其优雅地把代数数论里的深奥工具，跨界应用到了几何问题上。这就像是在一个原本以为已经填满的房间里，AI 突然发现了一扇通往新维度的门。

有网友对此讨论得很有深度。有人认为，这种跨领域的“组合创新”本质上就是一种高级的插值，因为工具本身是人类发明的。但也有观点反驳，如果 AI 仅仅是复读机，它怎么可能在没有任何几何学训练的情况下，精准地调用代数数论的“武器库”来解决问题？

这让人想起计算机体系里的指令流水线。如果 LLM 只是简单的查表，它永远无法处理未定义的指令。现在的突破说明，模型内部已经形成了某种程度的“概念表征”，它能通过逻辑链条，在看似无关的知识层级之间进行函数调用。

这并不意味着数学家失业了。相反，当 AI 能在庞大的知识空间里进行高效搜索和路径探索时，人类的价值在于定义那些“值得被解决”的问题，并从 AI 给出的奇异解中，读出背后的真理。

数学的疆域远比我们看到的要大，也许我们之前只是在已知空间的边缘徘徊。
9 hours ago

VS Code插件漏洞，撕开供应链安全真面目 | blog

GitHub 内部约 3800 个仓库遭到泄露，起因是一名员工安装了带毒的 VS Code 扩展。这并非简单的插件问题，而是开发者生态中“信任”与“权限”失控的典型案例。

这事儿挺荒诞。GitHub 这种级别的公司，居然被一个 VS Code 扩展给捅了。

黑客 TeamPCP 正在网上叫卖这批代码，起拍价 5 万美元。他们并不想勒索，更像是在搞一场针对大型组织的盲拍。

问题不在于插件本身，而在于 VS Code 的设计逻辑。现在的编辑器就像一个没有沙箱的操作系统，插件拥有几乎等同于用户的权限。一旦你信任了一个看似正规的扩展，它就能像吸尘器一样，悄无声息地把你本地的私钥、Token 和环境变量全部吸走，然后通过看似正常的网络请求传出去。

有网友提到，这其实是开发者在用“交付速度”透支“安全债”。为了用上某个好用的工具，我们默认把系统的控制权交给了远在天边的开发者。

这种风险是结构性的。即便你不用 VS Code，只要你还在使用 npm、PyPI 这种高度依赖第三方包的生态，这种“供应链攻击”就永远存在。

现在的局面是，安全防线像是一层薄纸。黑客不需要攻破 GitHub 的核心架构，只需要搞定一个有权限的开发者终端，就能通过 Git Clone 把整座仓库搬空。

如果插件的权限边界一直这么模糊，我们所谓的“信任”到底是在信任代码，还是在赌运气？
9 hours ago

PhoneClaw 是一款运行在 iPhone 上的本地 AI Agent，无需联网即可完成推理与工具调用，完全离线、私密。

它内置 Gemma 4 和 MiniCPM-V 等本地模型，支持图片理解、语音交互（LIVE 模式）、健康数据查询、日历创建、提醒事项、通讯录管理、翻译等能力，所有数据都在设备端处理，不上传、不泄露。

无论是日常聊天、拍照问答，还是多轮任务执行，都能在手机本地完成。支持自定义 Skill，开发者可轻松扩展更多 iOS 原生功能。

项目已开放 TestFlight 测试，源码托管在 GitHub。适合追求隐私与本地智能的用户尝试。
9 hours ago

AI 不会取代程序员，只会极速拉开开发者差距 | blog

AI 并不是在取代开发者，而是在放大差异。对于拥有深厚技术底蕴的专家，它是如钢铁侠战甲般的效能倍增器；对于缺乏经验的初学者，它更像是一个会制造大量“技术债”的幻觉陷阱。

最近关于“Vibe Coding”（凭感觉编程）的讨论很有意思。有人觉得这是魔法，有人觉得这是在对着幽灵吵架。

其实真相挺残酷的：AI 并没有改变编程的本质，它只是一个极其强大的乘数。如果你本身的能力是 10，它能帮你变成 100；但如果你能力是 0，它只会帮你以更快的速度制造出一堆看似运行良好、实则无法维护的垃圾代码。

有网友提到，这种现象就像是数字时代的“达克效应”。对于非专业人士，AI 生成的 UI 看起来很美，因为他们看不出底层的逻辑漏洞；但对于专家，那些代码简直是维护的死胡同。这就像给一个业余选手一把吉他，他弹出的声音可能还凑合，但给到 Jimi Hendrix，他能创造出全新的世界。

现在的争议点在于，这种“放大效应”到底能持续多久？

有人担心，如果大家都习惯了这种“写完即弃”的模式，人类的底层工程能力会发生萎缩，最终从“钢铁侠”变成只能靠机器维持生命的“铁肺”。但也有观点认为，这其实是抽象层级的又一次跃迁。就像我们不再需要手动拨动电报开关，我们只需要描述想要的结果。

问题的核心不在于 AI 能做到什么，而在于你是否具备定义“好”的标准。如果你不知道什么是优雅的架构，你就无法指挥 AI 避开那些隐蔽的坑。

当代码的生产成本趋近于零，人类真正的护城河，究竟是那些写出来的字符，还是那个决定“为什么要这么写”的意图？
9 hours ago

Dolphin 是 DataoceanAI 与清华大学联合研发的多语种、多任务语音识别模型。它支持东亚、南亚、东南亚及中东 40 种东方语言，以及 22 种中国方言，训练数据超过 21 万小时，可同时完成语音识别、语音活动检测、分段和语种识别。

项目提供 base、small、medium、large 等不同规模模型，以及针对中文方言优化的 small.cn、small.cn.prompt 等变体，支持词级时间戳预测与热词偏置功能。安装后仅需一条命令即可在命令行或 Python 中快速调用。

代码与模型权重均采用 Apache-2.0 许可开源，欢迎开发者与研究者下载使用。