Skip to main content

黑洞资源笔记

  1. 机器学习方案手册,一本包含逐步说明为各种任务训练深度学习模型的书。内容覆盖自然语言处理、计算机视觉、图像与文字

    本书分为3个部分:
    自然语言处理(NLP)
    计算机视觉(CV)
    图片和文字

    以下是本节各章的简要概述:

    命名实体识别- 讨论使用conllpp 数据集识别命名实体的训练转换器模型。我们将使用的特定模型称为bert-base-cased。该模型是原始 BERT 的较小版本,并且区分大小写,这意味着它将大写和小写字母视为不同。

    掩蔽语言建模- 与填空问题类似,我们训练一个模型来使用xsum 数据集预测句子中的掩蔽词。我们将使用的特定模型称为distilbert-base-uncased。这是 bert base uncased 模型的精炼版本,它以相同的方式处理大写和小写字母。

    机器翻译——在本章中,训练一个模型将文本从英语翻译成西班牙语。我们将在新闻评论数据集上训练来自赫尔辛基 NLP 小组的变压器模型。

    总结——在本章中,训练了一个多语言模型来总结英语和西班牙语句子。使用的模型是 T5 Transformer 模型的多语言版本,使用的数据集是amazon reviews dataset。

    因果语言建模- 本章重点介绍训练模型以自动完成 Python 代码。为此,我们将使用用于训练代码鹦鹉模型的数据。

    计算机视觉部分涵盖了该领域下最常见的任务。本节中的章节使用pytorch 闪电、pytorch 图像模型(timm)、 albumentations库和权重和偏差平台。以下是本节各章的简要概述:

    图像分类- 我们将训练卷积神经网络 (CNN) 模型对动物图像进行分类。我们将使用的 CNN 模型是“resnet34”,使用的数据集是动物图像数据集。

    图像分割- 本章侧重于训练模型以分割给定图像中的道路。我们将使用 U-net 模型来完成此任务。

    物体检测——在本章中,我们将专注于检测图像中的汽车。我们将预测与图像中包围汽车的边界框相对应的坐标。对于这个任务,我们将使用 fast-rcnn 模型。

    最后一节包含训练模型以在给定图像的情况下生成标题的章节。它将有一个视觉转换器作为编码器,gpt-2 模型作为解码器。

    在线阅读 | ML Recipe | #电子书 #机器学习 #手册
  2. 一个为MVVM设计的基于节点的编辑器的高性能控件集合。

    特性:
    从一开始就设计用于MVVM
    除了WPF之外没有其他依赖项
    针对一次与数百个节点的交互进行了优化
    内置深色和浅色主题
    区域选择、缩放、靠近边缘时自动平移
    选择、移动和连接节点
    许多可配置的依赖属性
    准备撤消/重做
    示例应用:🎨 游乐场🌓 状态机💻 计算器

    Github | Docs | Wiki
  3. GitHub上一份不间断更新的机器学习研究笔记,目前收获了6.4k个star。

    这份笔记的作者是香港浸会大学数学系徐亦达教授,最近两年在全心研究和分享 learning theory 的知识,从2022年开始,教授定期每晚8:30进行Learning Theory直播。

    Learning theory是教育学和教育心理学的一门分支学科,它描述了学生在学习过程中如何接受、处理和保留知识。认知、情感和环境的影响,以及先前的经验,都在如何获得或改变理解或世界观以及保留知识和技能方面发挥着作用。

    Learning theory | #机器学习 #笔记
  4. 原水木年华的成员之一姚勇,也是个程序员,带领团队开发了H3D游戏引擎,并用这个引擎编写了《QQ炫舞》。他还在06年翻译了《GPU精粹》一书。另外他还是作家兼程序员王小波的外甥
  5. 一款开源的跨平台 SQL 编辑器,提供 SQL 语法高亮、自动补全、数据表内容筛选与过滤、连接 Web 数据库、存储历史查询记录等功能

    该编辑器支持 SQLite、MySQL、MariaDB、Postgres 等主流数据库,并兼容 Windows、macOS、Linux 等桌面操作系统。

    Beekeeper Studio |#sql #编辑器
  6. 腾讯开源了个新项目embedx。 embedx是基于 c++ 开发的、完全自研的分布式 embedding 训练和推理框架。它目前支持 图模型、深度排序、召回模型和图与排序、图与召回的联合训练模型等

    目前已经在腾讯的多个产品上应用。已经实现的模型:
    十亿级节点、千亿级边的 图模型
    百亿级样本、百亿特征的 深度排序、召回模型
    十亿级节点、千亿级边与百亿级样本、百亿特征的 图与深度排序、图与深度召回的联合建模模型

    embedx
  7. 22省考精品考前集训营
    2022省考联考精品考前集训营(非全日制)最后一期
    考前冲刺必看,前100个下单的免费赠送第一期(已完结),欢迎咨询