Skip to main content

黑洞资源笔记

  1. 突破80年数学难题!OpenAI推理模型改写离散几何研究史 | blog

    OpenAI 的通用推理模型自主破解了存在 80 年之久的离散几何难题——单位距离问题。这不仅是 AI 首次独立解决数学领域的重大猜想,更通过跨学科的“降维打击”,证明了 AI 具备从现有知识中提取并建立全新逻辑连接的原创能力。

    关于“LLM 只是在对训练数据进行插值”的论调,最近被一个数学事实扇了耳光。

    大家常说 AI 没有创造力,只是在已有的知识凸包(Convex Hull)里做插值,也就是在已知点之间找过渡。但 OpenAI 的模型刚刚做了一件极其反直觉的事:它推翻了 Erdős 提出的单位距离问题猜想。这个猜想困扰了数学界 80 年,大家一直觉得“方格阵列”就是最优解,结果 AI 甩出了一个完全不同的构造方式。

    有意思的是,这个解法不是靠暴力穷举,而是极其优雅地把代数数论里的深奥工具,跨界应用到了几何问题上。这就像是在一个原本以为已经填满的房间里,AI 突然发现了一扇通往新维度的门。

    有网友对此讨论得很有深度。有人认为,这种跨领域的“组合创新”本质上就是一种高级的插值,因为工具本身是人类发明的。但也有观点反驳,如果 AI 仅仅是复读机,它怎么可能在没有任何几何学训练的情况下,精准地调用代数数论的“武器库”来解决问题?

    这让人想起计算机体系里的指令流水线。如果 LLM 只是简单的查表,它永远无法处理未定义的指令。现在的突破说明,模型内部已经形成了某种程度的“概念表征”,它能通过逻辑链条,在看似无关的知识层级之间进行函数调用。

    这并不意味着数学家失业了。相反,当 AI 能在庞大的知识空间里进行高效搜索和路径探索时,人类的价值在于定义那些“值得被解决”的问题,并从 AI 给出的奇异解中,读出背后的真理。

    数学的疆域远比我们看到的要大,也许我们之前只是在已知空间的边缘徘徊。
  2. VS Code插件漏洞,撕开供应链安全真面目 | blog

    GitHub 内部约 3800 个仓库遭到泄露,起因是一名员工安装了带毒的 VS Code 扩展。这并非简单的插件问题,而是开发者生态中“信任”与“权限”失控的典型案例。

    这事儿挺荒诞。GitHub 这种级别的公司,居然被一个 VS Code 扩展给捅了。

    黑客 TeamPCP 正在网上叫卖这批代码,起拍价 5 万美元。他们并不想勒索,更像是在搞一场针对大型组织的盲拍。

    问题不在于插件本身,而在于 VS Code 的设计逻辑。现在的编辑器就像一个没有沙箱的操作系统,插件拥有几乎等同于用户的权限。一旦你信任了一个看似正规的扩展,它就能像吸尘器一样,悄无声息地把你本地的私钥、Token 和环境变量全部吸走,然后通过看似正常的网络请求传出去。

    有网友提到,这其实是开发者在用“交付速度”透支“安全债”。为了用上某个好用的工具,我们默认把系统的控制权交给了远在天边的开发者。

    这种风险是结构性的。即便你不用 VS Code,只要你还在使用 npm、PyPI 这种高度依赖第三方包的生态,这种“供应链攻击”就永远存在。

    现在的局面是,安全防线像是一层薄纸。黑客不需要攻破 GitHub 的核心架构,只需要搞定一个有权限的开发者终端,就能通过 Git Clone 把整座仓库搬空。

    如果插件的权限边界一直这么模糊,我们所谓的“信任”到底是在信任代码,还是在赌运气?
  3. PhoneClaw 是一款运行在 iPhone 上的本地 AI Agent,无需联网即可完成推理与工具调用,完全离线、私密。

    它内置 Gemma 4 和 MiniCPM-V 等本地模型,支持图片理解、语音交互(LIVE 模式)、健康数据查询、日历创建、提醒事项、通讯录管理、翻译等能力,所有数据都在设备端处理,不上传、不泄露。

    无论是日常聊天、拍照问答,还是多轮任务执行,都能在手机本地完成。支持自定义 Skill,开发者可轻松扩展更多 iOS 原生功能。

    项目已开放 TestFlight 测试,源码托管在 GitHub。适合追求隐私与本地智能的用户尝试。
  4. AI 不会取代程序员,只会极速拉开开发者差距 | blog

    AI 并不是在取代开发者,而是在放大差异。对于拥有深厚技术底蕴的专家,它是如钢铁侠战甲般的效能倍增器;对于缺乏经验的初学者,它更像是一个会制造大量“技术债”的幻觉陷阱。

    最近关于“Vibe Coding”(凭感觉编程)的讨论很有意思。有人觉得这是魔法,有人觉得这是在对着幽灵吵架。

    其实真相挺残酷的:AI 并没有改变编程的本质,它只是一个极其强大的乘数。如果你本身的能力是 10,它能帮你变成 100;但如果你能力是 0,它只会帮你以更快的速度制造出一堆看似运行良好、实则无法维护的垃圾代码。

    有网友提到,这种现象就像是数字时代的“达克效应”。对于非专业人士,AI 生成的 UI 看起来很美,因为他们看不出底层的逻辑漏洞;但对于专家,那些代码简直是维护的死胡同。这就像给一个业余选手一把吉他,他弹出的声音可能还凑合,但给到 Jimi Hendrix,他能创造出全新的世界。

    现在的争议点在于,这种“放大效应”到底能持续多久?

    有人担心,如果大家都习惯了这种“写完即弃”的模式,人类的底层工程能力会发生萎缩,最终从“钢铁侠”变成只能靠机器维持生命的“铁肺”。但也有观点认为,这其实是抽象层级的又一次跃迁。就像我们不再需要手动拨动电报开关,我们只需要描述想要的结果。

    问题的核心不在于 AI 能做到什么,而在于你是否具备定义“好”的标准。如果你不知道什么是优雅的架构,你就无法指挥 AI 避开那些隐蔽的坑。

    当代码的生产成本趋近于零,人类真正的护城河,究竟是那些写出来的字符,还是那个决定“为什么要这么写”的意图?
  5. Dolphin 是 DataoceanAI 与清华大学联合研发的多语种、多任务语音识别模型。它支持东亚、南亚、东南亚及中东 40 种东方语言,以及 22 种中国方言,训练数据超过 21 万小时,可同时完成语音识别、语音活动检测、分段和语种识别。

    项目提供 base、small、medium、large 等不同规模模型,以及针对中文方言优化的 small.cn、small.cn.prompt 等变体,支持词级时间戳预测与热词偏置功能。安装后仅需一条命令即可在命令行或 Python 中快速调用。

    代码与模型权重均采用 Apache-2.0 许可开源,欢迎开发者与研究者下载使用。