黑洞资源笔记

16:27 · Apr 24, 2024 · Wed

seemore：用 PyTorch 从头开始实现的视觉语言模型
16:25 · Apr 24, 2024 · Wed

CoreNet: Apple的深度网络训练库，用于训练深度神经网络，支持各种任务，包括基础模型(如 CLIP 和 LLM)、目标分类、目标检测和语义分割
15:18 · Apr 24, 2024 · Wed

微信发布一款桌面工作效率的AI工具：小微助手，可搜索电脑中所有内容。| #工具

通过你对该工具的授权，它可以使用自然语言搜索你电脑里指定文件夹的所有内容，同时还支持在线聊天问答，类似ChatGPT。

还有一个圈子功能允许组织成员共同分享和使用各种数据和服务，还能接入OpenAI等模型。

同时还内置多种应用，如剪贴板收藏、微信翻译、闪念胶囊工具。

工具
14:56 · Apr 24, 2024 · Wed

Adobe 正式宣布推出新的图像生成模型 Firefly Image 3，即日起在 Firefly Web 应用程序、Adobe Photoshop 和 Adobe InDesign 中提供测试版，并在「今年晚些时候」全面上市，旨在让创作者能够提高工作效率，生成更高质量、更详细的图像。 | 详文
01:19 · Apr 22, 2024 · Mon

2024【新】零声linuxC++高级开发
16:10 · Apr 20, 2024 · Sat

用 ORPO 将 Llama 3 的性能提升到新高度 | 详文

ORPO(Odds Ratio Preference Optimization)是一种新的微调技术，可以将传统的监督微调和偏好对齐阶段合并为一个过程，从而减少计算资源和训练时间。

ORPO通过修改语言建模目标，将负对数似然损失与比值(OR)项相结合，以弱化被拒绝的响应并强化被选择的响应，让模型同时学习目标任务和人类偏好。

文章使用TRL库中的ORPOTrainer在Llama 3 8B模型上进行ORPO微调，数据集包含DPO偏好对，共1000个样本。尽管由于样本量少仅训练了1个epoch，但微调后的模型在Nous的基准测试中表现良好，所有指标上均优于Llama 3原模型。

ORPO展现了作为新的微调范式的潜力，未来在更大规模的偏好数据集上进行充分训练将产生更好的效果。选择高质量的数据集也非常重要。

当前是开源社区的活跃时期，正在发布越来越多高质量的开源模型，开源模型与专有模型的差距正在缩小，微调是获得最佳性能的关键。
15:54 · Apr 20, 2024 · Sat

原文
15:47 · Apr 20, 2024 · Sat

Craft 怎么在生产力工具里设计声音 | blog

Craft（Notion 的竞品）介绍了他们在产品里加入声音/音效的整个过程

开始单纯的点击音效很冷，也没有主题。之后选择了模拟真实世界里的声音，并且更微妙、低调地融入操作

声音设计师录制了翻书、写字、擦橡皮等自然声音，并把它们扩展成了一个声音的“设计系统”
15:43 · Apr 20, 2024 · Sat

Python 套件管理器——Poetry 完全入門指南 | #指南

指南
15:41 · Apr 20, 2024 · Sat

supabase 最近开源了一个 PostgreSQL 插件，可以直接提供数据库索引的建议，以提高查询性能。

可以直接在 supabase 上进行安装，也可以直接学习 SQL 看看原理。

PostgreSQL Index Advisor | #插件

插件
15:35 · Apr 20, 2024 · Sat

ddns-go：可以免内网穿透，通过 ipv6，轻松的将域名绑定到自己的电脑或手机上，适合不想买服务器，又想别人访问自己的服务的独立开发者
15:22 · Apr 20, 2024 · Sat

Form Extractor Prototype：使用 Claude 3 LLM 模型的工具，可以从表单图像中提取结构，并将其转换为符合 GOV.UK 表单模式的 JSON 结构，然后生成多页面的 Web 表单
15:21 · Apr 20, 2024 · Sat

json-repair：提供了一个名为 json-repair 的工具，用于修复从语言模型(LLM)产生的 JSON 格式异常 | #工具

工具
15:20 · Apr 20, 2024 · Sat

CIANNA - 天体物理学家的卷积交互式人工神经网络

CIANNA 是一个通用深度学习框架，主要开发和用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。

CIANNA 可用于构建和训练用于各种任务的大型神经网络模型，并提供高级 Python 接口（类似于 keras、pytorch 等）。

CIANNA 的特点之一是其定制实现的受 YOLO 启发的物体检测器，用于 2D 或 3D 射电天文数据产品中的星系检测。该框架通过低级 CUDA 编程完全由 GPU 加速。

CIANNA | #框架

框架
15:18 · Apr 20, 2024 · Sat

A Web Component for Math Input：为网页提供易于使用的数学公式输入界面的强大 Web 组件
15:16 · Apr 20, 2024 · Sat

BeyondLLM：用于实验、评估和部署基于检索增强生成 (RAG) 的系统的工具包，支持各种大语言模型 (LLM)，旨在减少 LLM 幻觉风险并提高可靠性
15:15 · Apr 20, 2024 · Sat

国区可用，任天堂模拟器 Delta 上架 App Store

此前只能在 AltStore 等第三方侧载渠道提供的任天堂掌机模拟器「Delta」刚刚上架了 App Store，这款模拟器支持包括「NES」、「SNES」、「N64」、「GBC」、「GBA」、「NDS」在内的大量经典任天堂设备模拟，App目前完全免费
15:11 · Apr 20, 2024 · Sat

一个开源好用的汉字笔画书写练习库 Hanzi Writer

通过这个JavaScript库可以根据汉字书写时按照笔画顺序的特征，播放正确笔画顺序的描边动画和练习测试。

提供 9000 多常用的简体字和繁体字，库大小仅 30kb，可以嵌入到任何平台应用，如 Web、iOS 或 Android 等。
15:06 · Apr 20, 2024 · Sat

60秒完成Linux系统的性能分析 | 原文 | 译文

原文出自Netflix技术团队的博客。

在本文中，Netflix性能工程团队将使用您应该使用的标准Linux工具在命令行中向你展示一个性能诊断过程的前60秒。在60秒内，可以通过运行图中十个命令来了解有关系统资源使用和运行进程的信息。

最应该关注的是一些很容易理解的错误、饱和度指标和资源利用率等指标。饱和度是衡量资源负载超出其处理能力的指标，它可以通过观察请求队列的长度或等待时间反映出来。
08:18 · Apr 20, 2024 · Sat

2024 华为hcie数通认证尊享班 6期肖哥版