Skip to main content

黑洞资源笔记

  1. 数据压缩快速入门课程

    由于每天产生的数据不断增长,以压缩形式存储数据的需求变得越来越重要。为了跟上这种数据洪流,数据压缩是在具体应用程序中提供优质服务的必要步骤。

    在本入门课程中,你将了解基本的数据压缩算法,这些算法都被我们每天使用的工具广泛采用,例如文件系统、计算机网络、搜索引擎和数据库。这些算法现在已经成为计算领域许多领域不可或缺的知识,包括信息检索、机器学习、自然语言处理、应用物理学和生物信息学
  2. TorchOpt:基于PyTorch构建的高性能优化器库,可轻松实现函数优化和基于梯度的元学习

    它包括两个主要功能:

    TorchOpt 提供了功能优化器,可以为 PyTorch 启用类似 JAX 的可组合功能优化器。使用 TorchOpt,可以轻松地在 PyTorch 中使用函数式优化器进行神经网络优化,类似于 JAX 中的Optax。

    借助函数式编程的设计,TorchOpt 为基于梯度的元学习研究提供了高效、灵活且易于实现的可微优化器。它在很大程度上减少了实现复杂的元学习算法所需的工作量。
  3. Squirrel Core:一个Python库,能让机器学习团队以协作、灵活和高效的方式共享、加载和转换数据

    特性:
    SPEED:避免数据停顿,即昂贵的GPU在等待数据时不会空闲。

    成本:首先,避免 GPU 停顿,其次允许对数据进行分片和集群,并将其存储和加载到包中,从而降低数据桶云存储的成本。

    灵活性:使用灵活的标准数据方案,该方案适用于任何设置,包括多模式数据。

    协作:以自助服务模式更轻松地在团队和项目之间共享数据和代码。
  4. nni:轻量但强大的工具包,帮助用户自动的进行 特征工程,神经网络架构搜索, 超参调优以及模型压缩
  5. funNLP,几乎最全的中文 #NLP 资源库。包括中英文敏感词、语言检测、中外手机 / 电话归属地 / 运营商查询、名字推断性别、手机号抽取、身份证抽取等内容