Skip to main content

黑洞资源笔记

  1. SoraWebui:一个开源项目,允许用户使用 OpenAI 的 Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能
  2. libLLM: 专为在普通个人电脑和移动设备上高效推理大型语言模型(LLM)而设计的开源项目。

    核心使用C++14编写,没有第三方依赖(BLAS、SentencePiece等),能在各种设备中无缝运行。

    特点
    为日常设备进行优化:libLLM经过优化,可在常见的个人电脑上平稳运行,确保大型语言模型的强大功能面向更广泛的用户。
    C++代码:采用标准C++14编写,简单高效。
    无外部依赖:核心功能无需第三方依赖(BLAS、SentencePiece等),所需的GEMM内核均在内部实现(avx2、avx512)。
    支持CUDA:支持使用CUDA加速推理。
  3. Owl:始终开启的可穿戴人工智能,探索将人工智能贯穿生活的可能性,以始终开启的可穿戴设备为载体。其主要特色包括:

    📱广泛的捕捉设备支持:使用基于 ESP 平台、Sony Spresense 或 Apple Watch 等消费类硬件的定制设备捕捉你的生活。不断添加其他设备支持,因此任何带有传感器的设备都能够向 Owl 发送数据。
    🧠灵活的推理选项:完全在本地运行或利用商业模型。使用Ollama上可用的任何模型进行推理,或使用 GPT-4 等商业模型。使用Whisper的 TTS或选择 Deepgram 等商业服务。
    🌐从网络捕获:轻松从桌面或任何手机捕获内容。
    🎙多模式捕捉:持续捕捉位置和音频。对图像和视频的支持即将推出!
    📶广泛的连接选项:使用支持 BLE、LTE 或 WiFi 的设备进行捕获。
    🚶‍♂️随时随地的交互式 AI:通过本机 iOS 和 Web 界面轻松与你的 AI 交互(Android 支持即将推出!)。
    🔊说话者验证:你的人工智能会学习你的声音,因此它知道你何时在说话。
    📡流媒体和离线模式:将你的生活实时传输到人工智能以获取主动帮助,或在网络受限的环境中切换到离线模式。
    💬高级对话理解:利用基于 VAD 的对话端点来细分和理解你的交互。
  4. 用于编辑可伸缩矢量图形(SVG)文件的工具。与其他编辑器不同,它直接表示SVG代码,不添加任何元数据,并允许实时编辑SVG代码。其主要特色在于实时交互式SVG编辑,优化的SVG输出以及移动设备可访问性。

    GodSVG | #工具
  5. Nendo Platform:一个用于人工智能驱动的音频管理、智能和生成的开源平台。

    它是一个功能丰富的 Web 应用程序堆栈,用于开发和运行基于Nendo Core及其插件生态系统的工具。
  6. 收集C/C++新手学习的入门项目,整理收纳开发者开源的小项目、工具、框架、游戏等,视频,书籍,面试题/算法题,技术文章。| github | #c++
  7. BlackJAX是一个基于Python和JAX的库,用于实现贝叶斯计算中常用的采样和变分推断算法。

    该库通过函数式编程方法提高了易用性、速度和模块化,使得统计‘原子’能够灵活组合以执行精确的贝叶斯推断。其核心特色在于支持构建复杂采样方法和推断模型,尤其适合需要尖端方法的用户、研究人员和有志于深入理解这些方法的人。

    BlackJAX的设计原则强调了纯函数式结构以简化并行化,并提供了低级API,使用户能够实现定制的复杂方法。BlackJAX鼓励重新引入结构感知算法,以适应现代模型推断的需求。
  8. ComfyUI Portrait Master:ComfyUI的Portrait Master节点,旨在帮助AI图像创作者生成人像提示。提供多种参数控制,如头像类型、性别、种族、眼睛颜色、头发风格等,与SDXL和LCM等工作流兼容性。提供了一套完整的工作流程,可在不同的环境中生成高分辨率图像