The Well: 15TB of Physics Simulations

物理仿真数据集规模空前,涵盖生物系统、流体力学、声波散射、磁流体动力学等多领域。The Well 提供了总量达15TB的高质量物理模拟数据,方便机器学习和计算科学研究者做模型训练与评估。

项目集成16个不同数据集,支持直接下载或从 Hugging Face 流式访问,配合PyTorch接口可轻松加载训练。还提供基准模型和训练脚本,助力科研人员快速验证和改进物理场的数值模拟与PDE代理模型。

主要特点:

- 涵盖多种物理领域的高精度仿真数据,数据规模达15TB;
- 提供易用的Python接口,支持分布式训练和数据流式加载;
- 包含基准测试和预训练模型,方便性能对比和模型迭代;
- 支持本地下载和云端流式访问,灵活适配不同计算环境;
- 由多所知名科研机构联合开发,质量和权威性有保障。

适合机器学习研究者、物理模拟开发者和计算科学团队,推动跨学科AI科研创新。
All In One USB Drive | #工具

多合一启动U盘工具集,集合了各种系统安装器、救援工具和实用程序,方便随时应对各种电脑维护和系统重装需求。支持将多个ISO镜像整合到一个U盘,通过Ventoy实现直接启动,操作简单,更新灵活。

主要功能:

- Linux系统救援套件和磁盘镜像工具;
- 多种主流Linux发行版和Windows安装镜像;
- Windows及Office激活脚本支持;
- 详细步骤指导,轻松制作和使用多启动U盘;
- 支持常见平台格式,满足不同场景需求。
十年前的一本多语言版的逆向工程权威指南,含中文版 | #电子书
Machine Learning Engineering Open Book(机器学习工程开放书)

Stas Bekman创建并维护的一份开源技术指南。该项目旨在收集和分享关于大语言模型及多模态模型训练、微调和推理的实用方法论、工具及详细步骤。| #指南

内容从底层硬件(计算加速器、CPU、内存)到软件基础设施(文件存储、网络、SLURM 调度系统)的各个层面,特别关注在大规模分布式系统中遇到的调试、优化和测试等工程难题。

对于希望深入了解如何构建高效 ML 训练集群或解决实际训练崩溃问题的机器学习工程师和研究人员来说,这是一份极具价值的实战手册。
爱丽丝漫游可微仙境:Alice’s Adventures in a differentiable wonderland | #电子书

这是本一路用直观的语言和可运行的代码教会你亲手构建现代神经网络的书。“神经网络无处不在——大型语言模型、语音转写、分子发现算法、机器人系统……剥开外衣,它们都只是可微基元的组合;研究神经网络,就是在学习如何“编程”并与这些模型交互,这正是所谓的“可微编程”。

这本入门读物,为像爱丽丝一样刚刚跌入这片奇异可微仙境的你而写。我将概览如何通过自动微分来优化函数,并精选最常见的架构来处理序列、图、文本与音频。

全书聚焦直觉、自成体系地介绍最重要的设计技巧——卷积块、注意力块、循环块——力求在理论与代码(PyTorch 与 JAX)之间架起桥梁,使读者最终能够理解当今最前沿的模型,如大语言模型 (LLM) 与多模态架构。”

作者现在开始写第二卷了,先放出了一章介绍强化学习的:内容涉及大型语言模型的后训练技术,聚焦于强化学习在模型微调中的作用 。内容兼具广度(历史演进)与深度(数学推导)的技术文档。系统讲解了从奖励建模(Reward Modeling)、策略梯度(Policy Gradient)到PPO、GRPO及DPO等前沿算法的数学推导与应用细节 。
Intelligent Robot Simulator (IR-SIM) 是一款基于 Python 的轻量级机器人仿真器,专注于导航、控制和强化学习的快速验证。与那些功能强大但臃肿的机器人模拟器不同,IR-Sim 不依赖复杂的物理引擎,适合快速搭建和测试算法。

IR-Sim 的核心优势:
- 安装快捷,配置简单
- 场景用 YAML 文件定义,易于管理
- 使用 Matplotlib 实时可视化
- 内置碰撞检测,支持多机器人避障
- 适合 AI 和强化学习的开发流程

它能帮你快速原型设计多机器人避障、基于激光雷达的导航、动态障碍物环境下的行为测试,甚至在进入大型仿真平台前完成高层次的算法验证。

该项目开源且活跃维护,已有多篇导航与规划领域的科研论文采用它。对于学生、研究者或导航算法爱好者,IR-Sim 是一种无需庞大依赖,快速试验想法的极佳工具。

技术选择不仅关乎功能, 更是效率和灵活性的权衡。简化工具链,聚焦核心需求,才能让创新更快落地。
Google Labs 推出全新实验项目“Disco”,开启探索生成式AI功能的全新体验。首个功能GenTabs,借助Gemini 3技术,将你打开的网页标签页重新组合,打造个性化定制的网络应用,帮助你更高效利用网络资源。

这不仅是AI能力的叠加,更是工作流程的变革。GenTabs能够整合你不同网页信息,如旅行计划、购物清单,实现智能推荐和协同操作,极大提升生产力和协作体验。

Google正悄然将AI深植于互联网底层,打造人人可用的定制化智能应用,这不仅是技术创新,更是数字生活方式的升级。未来,浏览器将不再只是信息载体,而是你的智能助手和创作平台。
Back to Top