Skip to main content

黑洞资源笔记

  1. OneFlow v0.9.0更新,分布式深度学习框架

    此更新包含 640 个提交和以下亮点:

    1.OneFlow v0.9.0 增加了 86 个与 PyTorch 对齐的新 API 接口和运算符,并修复了 104 个与运算符兼容性相关的错误,从而提供了更好的 PyTorch API 和模型兼容性。在 v0.9.0 中,用户可以一键将更多 PyTorch 模型迁移到 OneFlow,获得更快的性能。
    2.支持一键迁移Stable Diffusion、GLM、YOLOv5等到OneFlow。
    3.更方便的模型迁移。Oneflow.load支持torch.save直接加载模型。
    4.通过新增的oneflow.mock_torch模块和mock方法,oneflow可以在不改变原有PyTorch脚本的情况下,一键迁移包含多个脚本的复杂PyTorch模型。
    5.Global Tensor增加了一系列方便分布式编程的接口和方法,并修复了已知的相关bug。
    6.The Graph 发布了自动并行(version 1)的新特性,支持自动搜索指定 Placement 下最快的 SBP。使用 Global Tensor 编写分布式模型时,用户无需考虑并行性。
    7.The Graph 添加了一系列与内存、执行速度、管道屏蔽和编译速度相关的优化,以提高性能并减少内存开销。
    8.Graph提供了一系列辅助调试的功能,包括分析内存日志、显示编译阶段的进度、计算图等。
    9.OneFlow IR 提供了更多的编译优化功能。
    10.OneFlow的错误提示更加人性化,支持高亮显示错误内容,简化系统内部不必要的信息细节。就此而言,您可以直观地了解错误的位置和类型。
    11.增加了一系列算子优化和系统优化,包括Eager指令调度、高性能CUDA内核、开放多个内存池等。

    github | #框架
  2. 使用 sbuild、mmdebstrap 和 apt-cacher-ng 快速构建 Debian 软件包

    文章中提供了一个快速教程,介绍如何使用sbuildwithmmdebstrap和来设置快速的 Debian 软件包构建apt-cacher-ng。

    blog | #教程
  3. 基于语义搜索和文本生成的领域知识问答

    基于领域知识(如内部文档、合同、书籍等)回答问题具有挑战性,因为它需要处理大型文档。在这篇文章探索了一种先进的技术,以实现对大文本的高精度问答,将语义搜索和文本生成与 GPT-3、GPT-J 或 GPT-NeoX 等模型相结合。| 详文
  4. 一个可以运行脚本的分布式后端key-value引擎。可以用来建你自己的服务器。

    Lockval Engine常用于游戏后端和中小应用后端,集成了网络网关模块、数据存储模块和逻辑脚本处理模块,以及触发器模块。你只需要处理请求、响应和获取数据,计算和设置数据。变更数据会自动同步到接口调用方。

    Lockval Engine | dl | 配置文档 | blog Lockval Engine