Skip to main content

黑洞资源笔记

  1. 突破80年数学难题!OpenAI推理模型改写离散几何研究史 | blog

    OpenAI 的通用推理模型自主破解了存在 80 年之久的离散几何难题——单位距离问题。这不仅是 AI 首次独立解决数学领域的重大猜想,更通过跨学科的“降维打击”,证明了 AI 具备从现有知识中提取并建立全新逻辑连接的原创能力。

    关于“LLM 只是在对训练数据进行插值”的论调,最近被一个数学事实扇了耳光。

    大家常说 AI 没有创造力,只是在已有的知识凸包(Convex Hull)里做插值,也就是在已知点之间找过渡。但 OpenAI 的模型刚刚做了一件极其反直觉的事:它推翻了 Erdős 提出的单位距离问题猜想。这个猜想困扰了数学界 80 年,大家一直觉得“方格阵列”就是最优解,结果 AI 甩出了一个完全不同的构造方式。

    有意思的是,这个解法不是靠暴力穷举,而是极其优雅地把代数数论里的深奥工具,跨界应用到了几何问题上。这就像是在一个原本以为已经填满的房间里,AI 突然发现了一扇通往新维度的门。

    有网友对此讨论得很有深度。有人认为,这种跨领域的“组合创新”本质上就是一种高级的插值,因为工具本身是人类发明的。但也有观点反驳,如果 AI 仅仅是复读机,它怎么可能在没有任何几何学训练的情况下,精准地调用代数数论的“武器库”来解决问题?

    这让人想起计算机体系里的指令流水线。如果 LLM 只是简单的查表,它永远无法处理未定义的指令。现在的突破说明,模型内部已经形成了某种程度的“概念表征”,它能通过逻辑链条,在看似无关的知识层级之间进行函数调用。

    这并不意味着数学家失业了。相反,当 AI 能在庞大的知识空间里进行高效搜索和路径探索时,人类的价值在于定义那些“值得被解决”的问题,并从 AI 给出的奇异解中,读出背后的真理。

    数学的疆域远比我们看到的要大,也许我们之前只是在已知空间的边缘徘徊。
  2. VS Code插件漏洞,撕开供应链安全真面目 | blog

    GitHub 内部约 3800 个仓库遭到泄露,起因是一名员工安装了带毒的 VS Code 扩展。这并非简单的插件问题,而是开发者生态中“信任”与“权限”失控的典型案例。

    这事儿挺荒诞。GitHub 这种级别的公司,居然被一个 VS Code 扩展给捅了。

    黑客 TeamPCP 正在网上叫卖这批代码,起拍价 5 万美元。他们并不想勒索,更像是在搞一场针对大型组织的盲拍。

    问题不在于插件本身,而在于 VS Code 的设计逻辑。现在的编辑器就像一个没有沙箱的操作系统,插件拥有几乎等同于用户的权限。一旦你信任了一个看似正规的扩展,它就能像吸尘器一样,悄无声息地把你本地的私钥、Token 和环境变量全部吸走,然后通过看似正常的网络请求传出去。

    有网友提到,这其实是开发者在用“交付速度”透支“安全债”。为了用上某个好用的工具,我们默认把系统的控制权交给了远在天边的开发者。

    这种风险是结构性的。即便你不用 VS Code,只要你还在使用 npm、PyPI 这种高度依赖第三方包的生态,这种“供应链攻击”就永远存在。

    现在的局面是,安全防线像是一层薄纸。黑客不需要攻破 GitHub 的核心架构,只需要搞定一个有权限的开发者终端,就能通过 Git Clone 把整座仓库搬空。

    如果插件的权限边界一直这么模糊,我们所谓的“信任”到底是在信任代码,还是在赌运气?
  3. PhoneClaw 是一款运行在 iPhone 上的本地 AI Agent,无需联网即可完成推理与工具调用,完全离线、私密。

    它内置 Gemma 4 和 MiniCPM-V 等本地模型,支持图片理解、语音交互(LIVE 模式)、健康数据查询、日历创建、提醒事项、通讯录管理、翻译等能力,所有数据都在设备端处理,不上传、不泄露。

    无论是日常聊天、拍照问答,还是多轮任务执行,都能在手机本地完成。支持自定义 Skill,开发者可轻松扩展更多 iOS 原生功能。

    项目已开放 TestFlight 测试,源码托管在 GitHub。适合追求隐私与本地智能的用户尝试。
  4. AI 不会取代程序员,只会极速拉开开发者差距 | blog

    AI 并不是在取代开发者,而是在放大差异。对于拥有深厚技术底蕴的专家,它是如钢铁侠战甲般的效能倍增器;对于缺乏经验的初学者,它更像是一个会制造大量“技术债”的幻觉陷阱。

    最近关于“Vibe Coding”(凭感觉编程)的讨论很有意思。有人觉得这是魔法,有人觉得这是在对着幽灵吵架。

    其实真相挺残酷的:AI 并没有改变编程的本质,它只是一个极其强大的乘数。如果你本身的能力是 10,它能帮你变成 100;但如果你能力是 0,它只会帮你以更快的速度制造出一堆看似运行良好、实则无法维护的垃圾代码。

    有网友提到,这种现象就像是数字时代的“达克效应”。对于非专业人士,AI 生成的 UI 看起来很美,因为他们看不出底层的逻辑漏洞;但对于专家,那些代码简直是维护的死胡同。这就像给一个业余选手一把吉他,他弹出的声音可能还凑合,但给到 Jimi Hendrix,他能创造出全新的世界。

    现在的争议点在于,这种“放大效应”到底能持续多久?

    有人担心,如果大家都习惯了这种“写完即弃”的模式,人类的底层工程能力会发生萎缩,最终从“钢铁侠”变成只能靠机器维持生命的“铁肺”。但也有观点认为,这其实是抽象层级的又一次跃迁。就像我们不再需要手动拨动电报开关,我们只需要描述想要的结果。

    问题的核心不在于 AI 能做到什么,而在于你是否具备定义“好”的标准。如果你不知道什么是优雅的架构,你就无法指挥 AI 避开那些隐蔽的坑。

    当代码的生产成本趋近于零,人类真正的护城河,究竟是那些写出来的字符,还是那个决定“为什么要这么写”的意图?
  5. Dolphin 是 DataoceanAI 与清华大学联合研发的多语种、多任务语音识别模型。它支持东亚、南亚、东南亚及中东 40 种东方语言,以及 22 种中国方言,训练数据超过 21 万小时,可同时完成语音识别、语音活动检测、分段和语种识别。

    项目提供 base、small、medium、large 等不同规模模型,以及针对中文方言优化的 small.cn、small.cn.prompt 等变体,支持词级时间戳预测与热词偏置功能。安装后仅需一条命令即可在命令行或 Python 中快速调用。

    代码与模型权重均采用 Apache-2.0 许可开源,欢迎开发者与研究者下载使用。
  6. Pyrefly 是一款专为 Python 打造的高性能类型检查器与语言服务器。它不仅能以极快速度完成类型检查,还内置了代码导航、自动补全、语义高亮等 IDE 功能,让开发者在命令行和编辑器中都能获得一致体验。

    项目在 Instagram 的 2000 万行代码库中得到大规模验证,同时也被 PyTorch、JAX 等知名开源项目采用。Pyrefly 内置对 Pydantic、Django 等主流框架的支持,开箱即用;迁移工具 pyrefly init、pyrefly suppress、pyrefly infer 则让从 Mypy 或 Pyright 切换变得轻松。

    目前支持 VSCode、Neovim、Zed 等编辑器,可通过 pip install pyrefly 快速安装。

    主要功能:
    - 闪电级类型检查,单秒可处理 185 万行代码;
    - 完整语言服务器,支持跳转、补全、悬停提示等;
    - 框架感知,Pydantic 与 Django 模型开箱即用;
    - 平滑迁移,提供一键初始化、错误抑制与类型推断;
    - CLI 与 IDE 结果一致,重新检查通常在 10 毫秒内完成。
  7. .NET 开发者的 AI 编码助手.NET Agent Skills 仓库为 Copilot、Claude Code 等工具提供了一整套官方精选技能插件,涵盖 .NET 数据访问、性能诊断、MSBuild 构建、NuGet 包管理、.NET MAUI、ASP.NET Core 以及 .NET 11 新特性等常见场景,让 AI 代理更懂 .NET,编码效率直接拉满。

    主要功能:
    - 核心 dotnet 插件,处理日常 .NET 编码任务
    - dotnet-data、dotnet-msbuild、dotnet-nuget 等细分领域技能
    - 支持 .NET 升级迁移、MAUI 开发、AI 集成等进阶场景
    - 兼容 Copilot CLI、Claude Code、Cursor、VS Code 等主流工具
    - 遵循 agentskills.io 标准,可快速安装与更新

    无论你是日常维护项目还是升级老代码,dotnet/skills 都能让 AI 代理更精准地帮你完成任务。
  8. oh-my-pi 把所有开发所需的能力直接塞进终端:支持 40+ 模型、32 种内置工具、LSP 代码智能、真实调试器、浏览器操作、子代理并行、GitHub 一体化读写……再也不用在 IDE、浏览器、命令行之间疯狂切换。

    一次安装即可拥有:哈希锚点精准编辑、结构化 AST 重构、持久化 Python/JS 沙箱、时间旅行规则注入、Hindsight 项目记忆……支持 macOS / Linux / Windows,本地即可运行,适合个人开发者与团队日常编码。

    主要功能:
    - 哈希锚点编辑:用内容哈希精准定位,首试即中,告别重试循环;
    - LSP & 调试器直连:重命名、诊断、断点、堆栈一步到位;
    - 子代理并行:任务自动拆分,多 worker 独立工作树,结果结构化返回;
    - 浏览器 & Web 搜索:内建 Puppeteer + 14 家搜索后端,PDF/网页直接转 Markdown;
    - 冲突与预览:合并冲突一键解决,AST 编辑先预览再落地;
    - 跨平台原生:无需 WSL,Windows/macOS/Linux 同一二进制;
    - 即插即用配置:自动继承 Cursor、Copilot、Claude 等已有规则,无需迁移。

    支持 Web、终端、Node SDK、ACP 协议多入口,通过 bun/npm 一键安装,适合需要「开箱即用、永不落伍」的 AI 编码工作流。
  9. AI Agent 治理工具包(Agent Governance Toolkit),它为自主 AI 代理提供策略执行、零信任身份、执行沙箱和可靠性工程,全面覆盖 OWASP Agentic Top 10 十大风险。

    核心能力包括:
    - 确定性策略引擎:每次工具调用、资源访问和代理间消息均在执行前评估,P50 延迟仅 0.012 ms,支持 YAML/OPA/Rego/Cedar;
    - 零信任身份:Ed25519 + 量子安全 ML-DSA-65 凭证,行为信任评分随异常衰减,并兼容 SPIFFE/SVID;
    - 四层执行沙箱:内核/主管/用户/不受信四级隔离,支持 Saga 编排与一键熔断;
    - 合规与审计:Merkle 链式防篡改日志,自动映射 EU AI Act、SOC 2、HIPAA、GDPR;
    - MCP 安全网关:检测工具投毒、描述漂移、隐藏指令等风险。

    支持 Python、TypeScript、.NET、Rust、Go 五种语言,兼容 LangChain、CrewAI、AutoGen、Semantic Kernel 等 20+ 主流框架。安装一行命令:pip install agent-governance-toolkit[full]。
  10. 找工作最怕的就是在多个平台翻找职位、反复投递却毫无回音。JustHireMe 把职位抓取、匹配度和材料定制全部集成到本地桌面应用里,让求职流程真正可控。

    它通过本地优先架构,自动从 ATS、RSS、社区等多源抓取职位,再用确定性规则与向量匹配对简历进行打分,过滤掉过时或低质岗位。匹配通过后还能一键生成针对该岗位的简历、求职信及多渠道沟通文案,全部在本地完成。

    项目采用 Tauri + React + Python FastAPI 构建,支持 Windows 一键安装;AGPL-3.0 许可,代码完全开源,方便扩展新的职位来源与排名策略。

    主要特性:
    - 多源职位抓取与质量门控,去重低质与过时岗位;
    - 确定性规则 + 向量匹配,给出可解释的匹配分数;
    - 本地生成定制化简历、求职信与外联文案;
    - 全部数据与模型在本地运行,隐私可控;
    - 支持添加自定义职位来源与排名规则。