Skip to main content

DeepMind 开源了 AlphaGo 和 AlphaZero 的核心Mctx 是一个具有JAX原生实现的蒙特卡洛树搜索 (MCTS) 算法(例如 AlphaZero、 MuZero和 Gumbel MuZero )的库

  1. DeepMind 开源了 AlphaGo 和 AlphaZero 的核心

    Mctx 是一个具有JAX原生实现的蒙特卡洛树搜索 (MCTS) 算法(例如 AlphaZero、 MuZero和 Gumbel MuZero )的库。为了加快计算速度,该实现完全支持 JIT 编译。Mctx 中的搜索算法是针对批量输入并行定义和操作的。这允许充分利用加速器,并使算法能够与由深度神经网络参数化的大型学习环境模型一起工作。

    Mctx:MCTS-in-JAX