Skip to main content

黑洞资源笔记

  1. CoreNet: Apple的深度网络训练库,用于训练深度神经网络,支持各种任务,包括基础模型(如 CLIP 和 LLM)、目标分类、目标检测和语义分割
  2. 微信发布一款桌面工作效率的AI工具:小微助手,可搜索电脑中所有内容。| #工具

    通过你对该工具的授权,它可以使用自然语言搜索你电脑里指定文件夹的所有内容,同时还支持在线聊天问答,类似ChatGPT。

    还有一个圈子功能允许组织成员共同分享和使用各种数据和服务,还能接入OpenAI等模型。

    同时还内置多种应用,如剪贴板收藏、微信翻译、闪念胶囊工具。
  3. Adobe 正式宣布推出新的图像生成模型 Firefly Image 3,即日起在 Firefly Web 应用程序、Adobe Photoshop 和 Adobe InDesign 中提供测试版,并在「今年晚些时候」全面上市,旨在让创作者能够提高工作效率,生成更高质量、更详细的图像。 | 详文
  4. 用 ORPO 将 Llama 3 的性能提升到新高度 | 详文

    ORPO(Odds Ratio Preference Optimization)是一种新的微调技术,可以将传统的监督微调和偏好对齐阶段合并为一个过程,从而减少计算资源和训练时间。

    ORPO通过修改语言建模目标,将负对数似然损失与比值(OR)项相结合,以弱化被拒绝的响应并强化被选择的响应,让模型同时学习目标任务和人类偏好。

    文章使用TRL库中的ORPOTrainer在Llama 3 8B模型上进行ORPO微调,数据集包含DPO偏好对,共1000个样本。尽管由于样本量少仅训练了1个epoch,但微调后的模型在Nous的基准测试中表现良好,所有指标上均优于Llama 3原模型。

    ORPO展现了作为新的微调范式的潜力,未来在更大规模的偏好数据集上进行充分训练将产生更好的效果。选择高质量的数据集也非常重要。

    当前是开源社区的活跃时期,正在发布越来越多高质量的开源模型,开源模型与专有模型的差距正在缩小,微调是获得最佳性能的关键。
  5. Craft 怎么在生产力工具里设计声音 | blog

    Craft(Notion 的竞品)介绍了他们在产品里加入声音/音效的整个过程

    开始单纯的点击音效很冷,也没有主题。之后选择了模拟真实世界里的声音,并且更微妙、低调地融入操作

    声音设计师录制了翻书、写字、擦橡皮等自然声音,并把它们扩展成了一个声音的“设计系统”
  6. ddns-go:可以免内网穿透,通过 ipv6,轻松的将域名绑定到自己的电脑或手机上,适合不想买服务器,又想别人访问自己的服务的独立开发者
  7. CIANNA - 天体物理学家的卷积交互式人工神经网络

    CIANNA 是一个通用深度学习框架,主要开发和用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。

    CIANNA 可用于构建和训练用于各种任务的大型神经网络模型,并提供高级 Python 接口(类似于 keras、pytorch 等)。

    CIANNA 的特点之一是其定制实现的受 YOLO 启发的物体检测器,用于 2D 或 3D 射电天文数据产品中的星系检测。该框架通过低级 CUDA 编程完全由 GPU 加速。

    CIANNA | #框架
  8. BeyondLLM:用于实验、评估和部署基于检索增强生成 (RAG) 的系统的工具包,支持各种大语言模型 (LLM),旨在减少 LLM 幻觉风险并提高可靠性
  9. 国区可用,任天堂模拟器 Delta 上架 App Store

    此前只能在 AltStore 等第三方侧载渠道提供的任天堂掌机模拟器「Delta」刚刚上架了 App Store,这款模拟器支持包括「NES」、「SNES」、「N64」、「GBC」、「GBA」、「NDS」在内的大量经典任天堂设备模拟,App目前完全免费
  10. 一个开源好用的汉字笔画书写练习库 Hanzi Writer

    通过这个JavaScript库可以根据汉字书写时按照笔画顺序的特征,播放正确笔画顺序的描边动画和练习测试。

    提供 9000 多常用的简体字和繁体字,库大小仅 30kb,可以嵌入到任何平台应用,如 Web、iOS 或 Android 等。
  11. 60秒完成Linux系统的性能分析 | 原文 | 译文

    原文出自Netflix技术团队的博客。

    在本文中,Netflix性能工程团队将使用您应该使用的标准Linux工具在命令行中向你展示一个性能诊断过程的前60秒。在60秒内,可以通过运行图中十个命令来了解有关系统资源使用和运行进程的信息。

    最应该关注的是一些很容易理解的错误、饱和度指标和资源利用率等指标。饱和度是衡量资源负载超出其处理能力的指标,它可以通过观察请求队列的长度或等待时间反映出来。