Skip to main content

黑洞资源笔记

  1. Klein Design System:微盟B端设计系统 | 详细介绍

    KleinDesign 是微盟用户体验团队&前端团队在服务业务过程中沉淀的一套服务于 SaaS 行业的企业级 WEB 端设计系统。包含设计指南、组件库、图标库、素材和物料管理工具、富文本编辑器等。
  2. 一个Chrome 浏览器扩展,能把外语视频里的语音替换成中文语音(不是字幕翻译)。目前不需要填写 OpenAI 的 API Key 来开启使用权限,需要邮箱注册。可以从四个预置的语音声线里选择一个你听着舒服的。

    特性:
    中文优化:更好的断句、更好的专业名词翻译,让翻译结果更贴近中文用户的习惯
    多语种支持:支持英语、德语、日语、法语、西班牙语等多种常见语种的互相转换
    更自然的声音:优化发音,让转换后的中文配音更人性化
    多种语音风格:支持男声、女声,不同风格的配音
    多平台支持(优化中):PC端、移动端等多平台的支持
    视频下载(开发中):支持下载配音转化之后的视频

    Youtube Dubbing | Chrome插件 | #插件
  3. Build your own X:从零创建你想要的技术,掌握编程技能,打造属于你自己的 X。包括3D渲染器、游戏、前端框架、文本编辑器、神经网络甚至操作系统。

    发现几年前发过这个:跳转
  4. 这个库可以让你在选择技术关键词后生成一个对应的路线图,从易到难,并且配有要学习对应知识点的文档,整个内容是社区驱动的,会不断更新。同时技术点也很多,几乎涵盖了前端后端等大部分的内容。

    roadmap.sh | #路线图
  5. 一种利用递归生成摘要来增强长期记忆能力的方法,以解决开放域对话系统在长对话中遗忘重要信息的问题。| paper
  6. Andrej Karpathy:大模型有内存限制,这个妙招挺好用

    “现在最聪明的想法是使用一个小而便宜的草稿模型(draft model),先生成 K 个 token 候选序列,即一个「草稿」。然后用大模型批量的将输入组合在一起。速度几乎与仅输入一个 token 一样快。接着从左到右遍历模型和样本 token 预测的 logits。任何与「草稿」一致的样本都允许立即跳到下一个 token。如果存在分歧,那么就丢弃「草稿」并承担一些一次性工作的成本(对「草稿」进行采样并为所有后续 token 进行前向传递)。

    这种方法起作用的原因在于,很多「草稿」token 都会被接受,因为它们很容易,所以即使是更小的草稿模型也能得到它们。当这些简单的 token 被接受时,我们会跳过这些部分。大模型不同意的 hard token 会回落到原始速度,但由于一些额外的工作,实际上速度会慢一些。

    Karpathy 表示,这个奇怪的技巧之所以有效,是因为 LLM 在推理时受到内存限制,在对单个序列进行采样的 batch size=1 设置中,很大一部分本地 LLM 用例都属于这种情况。因为大多数 token 都很「简单」。”
  7. Google 近日正式发布了新版 Chrome 应用商店的预览,相较于已经使用多年的线上版本,新版应用商店采用了更现代的设计语言,整体的设计风格十分接近新版本的 Android 系统。

    除了设计上的焕新,新版 Chrome 应用商店还着重强调了分类的概念,新的强区分设计可以帮助用户更快的定位到需要的拓展。根据 Google 的介绍,这版设计会在测试 1 - 2 个月后正式向所有用户推送。
  8. 一款强大的 AI 图片编辑器。该编辑器具有多种功能,包括快速添加、擦除、和进行 AI 图片编辑。

    而最重要的是你只需要输入文字,不需要其他任何操作,就像对话聊天一样,即可轻松的编辑图片内容。完全傻瓜式操作。

    它允许用户通过简单的文本提示进行复杂的图片编辑,包括删除不需要的背景元素、旋转、裁剪、文本转图片、添加滤镜等。同时还支持与团队成员或客户实时共享和编辑文件。

    Muse AI | #编辑器
  9. 一种基于 AI 和 现代GPU 的新型头发模拟技术。| link

    这种技术使用神经物理学(neural physics)来预测头发在现实世界中的行为。

    这种方法在头发模拟的性能方面表现出色,甚至可以根据发型的复杂性以交互式帧率进行计算。可以在 0.18 秒到接近 8 秒每帧的时间内完成。

    与最先进的基于 CPU 的解算器相比,它提供了显着的性能飞跃,将模拟时间从几天缩短到仅仅几个小时,同时还提高了实时头发模拟的质量。
  10. 本系列将介绍并实现一门简单的编程语言——Kaleidoscope,教程的每一章都会逐步对其编译器进行完善。同时会介绍编译原理相关的理论和知识,以及 LLVM 相关概念。每一章都会花费很大的篇幅对相关的代码实现进行解释。因此,强烈建议每一位读者亲自对代码进行实践。

    教程总共分为十章,每一章包含不同的主题,各章之间属于循序渐进的关系,各章相关的代码,也是通过增量修改实现的。如下所示,为各章的主题与内容简介。

    第1章 - Kaleidoscope 与词法分析器。介绍了目标以及实现的基本功能。词法分析器是为一门编程语言构建解析器的基础,我们使用 C++ 实现一个简单的词法分析器。
    第2章 - AST 与解析器。介绍了解析器相关技术,以及抽象语法树的构造。关于解析技术,本教程使用的是递归下降分析法和算符优先级分析法。
    第3章 - LLVM IR 代码生成。介绍了如何基于 AST 生成 LLVM IR,通过一种简单的方法将 LLVM 引入到编译器实现中。
    第4章 - JIT 与优化器支持。基于 LLVM 为 Kaleidoscope 实现 JIT 编译功能,同时加入对于优化器的支持。
    第 5 章 - 语言扩展:控制流。对 Kaleidoscope 进行语言扩展,实现控制流能力(if 语句和 for 语句)。同时,简单介绍了 SSA 的构造。
    第6章 - 语言扩展:自定义运算符。对 Kaleidoscope 进行语言扩展,实现自定义运算符能力,允许用户自定义一元运算符和二元运算符(支持运算符优先级)。
    第7章 - 语言扩展:可变变量。对 Kaleidoscope 进行语言扩展,实现局部变量和赋值操作符。同时,介绍了一种隐式的方法让 LLVM 自动构造 SSA。
    第8章 - 目标文件编译。介绍了如何基于 LLVM IR 编译生成目标文件。
    第9章 - 调试信息。支持调试器,添加调试信息,允许在 Kaleidoscope 函数中设置断点,打印参数变量和调用函数。
    第10章 - 总结。主要讨论语言扩展的进阶内容,比如指针、垃圾回收、异常、调试等。
  11. aidea: 一款集成了主流大语言模型以及绘图模型的 APP, 采用 Flutter 开发,代码完全开源,支持以下功能:

    支持 GPT-3.5/4 问答聊天
    支持国产模型:通义千问,文心一言
    支持文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0

    除IOS 国区目前不可用,其他所有区域都可以下载。

    开源代码:客户端 | 服务端 (即将开放)
    安装地址:Android/IOS APP | Mac桌面端 | Web端