Skip to main content

黑洞资源笔记

  1. DeepMind 开源了 AlphaGo 和 AlphaZero 的核心

    Mctx 是一个具有JAX原生实现的蒙特卡洛树搜索 (MCTS) 算法(例如 AlphaZero、 MuZero和 Gumbel MuZero )的库。为了加快计算速度,该实现完全支持 JIT 编译。Mctx 中的搜索算法是针对批量输入并行定义和操作的。这允许充分利用加速器,并使算法能够与由深度神经网络参数化的大型学习环境模型一起工作。

    Mctx:MCTS-in-JAX
  2. 为什么 GPT-3 的所有公开复制都失败了?我们应该在哪些任务中使用 GPT-3.5/ChatGPT?| blog

    作者Jingfeng Yang,亚马逊NLP研究科学家 ​​​