Skip to main content

黑洞资源笔记

  1. 本地LLM使用指南 0.2 | #指南

    LLMs,即大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。

    LLMs例如GPT、LLama、Mistral系列等,通过深度学习的技术架构,如Transformer,使得这些模型能够捕捉到文本之间深层次的关联和含义。模型首先在广泛的数据集上进行预训练,学习语言的一般特征和模式,然后可以针对特定的任务或领域进行微调,以提高其在特定应用中的表现。

    预训练阶段让LLMs掌握了大量的语言知识和世界知识,而微调阶段则使模型能够在特定任务上达到更高的性能。这种训练方法赋予了LLMs在处理各种语言任务时的灵活性和适应性,能够为用户提供准确、多样化的信息和服务。
  2. 构建你自己的 AI 辅助编码助手 | repo

    介绍如何 DIY 一个端到端(从 IDE 插件、模型选型、数据集构建到模型微调)的 AI 辅助编程工具,类似于 GitHub Copilot、JetBrains AI Assistant、AutoDev 等
  3. World's Easiest GPT-like Voice Assistant:超简单的类GPT语音助手,采用开源大型语言模型 (LLM) 以响应口头请求,完全在树莓派上本地运行。

    它不需要互联网连接或云服务支持。使用按钮触发录音,经过自动语音识别生成文本,然后由 TinyLlama-1.1B LLM 生成回复,并通过 eSpeak 语音合成器产生音频输出。
  4. SubFix是一个用于轻松地编辑修改音频字幕的网页工具。能够实时地看到改动,方便地对音频进行合并、分割、删除、编辑字幕。

    SubFix同时也支持自动化语音标注,使用modelscope和whisper对文本进行多语言标注。目前modelscope支持中文、英语、日语、德语、德语、俄语的自动化标注。whisper支持几乎所有语言。

    独立的.py文件版本,可以通过subfix_webui.py获取。该版本可以通过命令行参数来选择语言,支持英文和中文。同时可以选择在编辑时是否同步删除硬盘上的音频文件。

    SubFix | #工具
  5. Free Design Stuff:免费设计资源集合

    免费设计资源集合网站,包括免费字体、图标、插图、照片等设计素材,适用于个人和商业用途。提供各种设计工具和模板,适用于设计师和创作者。
  6. Word 网页版更新,加入复选框支持

    微软近日更新了网页版 Word 应用,本次更新带来了用户期待已久的复选框功能。微软表示:「复选框对于制定计划,或者撰写标准文档使用场景非常有效,还可用于跟踪进展和鼓励养成新习惯」。目前该更新已正式上线,所有用户都可使用「Ctrl + ,」组合键来插入复选框,并使用「Ctrl + Alt + Enter」来标记完成。
  7. 一份收录独立开发者出海技术栈和工具合集 | GitHub | #工具

    涵盖了 Web 开发模板、Chrome 插件开发模板、技术栈推荐,如前端、后端、数据库、支付等内容。

    收录标准如下:

    - 帮助独立开发者提升开发效率。
    - 帮助独立开发者降低成本。
    - 市场上足够流行
  8. SoraWebui:一个开源项目,允许用户使用 OpenAI 的 Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能
  9. libLLM: 专为在普通个人电脑和移动设备上高效推理大型语言模型(LLM)而设计的开源项目。

    核心使用C++14编写,没有第三方依赖(BLAS、SentencePiece等),能在各种设备中无缝运行。

    特点
    为日常设备进行优化:libLLM经过优化,可在常见的个人电脑上平稳运行,确保大型语言模型的强大功能面向更广泛的用户。
    C++代码:采用标准C++14编写,简单高效。
    无外部依赖:核心功能无需第三方依赖(BLAS、SentencePiece等),所需的GEMM内核均在内部实现(avx2、avx512)。
    支持CUDA:支持使用CUDA加速推理。
  10. Owl:始终开启的可穿戴人工智能,探索将人工智能贯穿生活的可能性,以始终开启的可穿戴设备为载体。其主要特色包括:

    📱广泛的捕捉设备支持:使用基于 ESP 平台、Sony Spresense 或 Apple Watch 等消费类硬件的定制设备捕捉你的生活。不断添加其他设备支持,因此任何带有传感器的设备都能够向 Owl 发送数据。
    🧠灵活的推理选项:完全在本地运行或利用商业模型。使用Ollama上可用的任何模型进行推理,或使用 GPT-4 等商业模型。使用Whisper的 TTS或选择 Deepgram 等商业服务。
    🌐从网络捕获:轻松从桌面或任何手机捕获内容。
    🎙多模式捕捉:持续捕捉位置和音频。对图像和视频的支持即将推出!
    📶广泛的连接选项:使用支持 BLE、LTE 或 WiFi 的设备进行捕获。
    🚶‍♂️随时随地的交互式 AI:通过本机 iOS 和 Web 界面轻松与你的 AI 交互(Android 支持即将推出!)。
    🔊说话者验证:你的人工智能会学习你的声音,因此它知道你何时在说话。
    📡流媒体和离线模式:将你的生活实时传输到人工智能以获取主动帮助,或在网络受限的环境中切换到离线模式。
    💬高级对话理解:利用基于 VAD 的对话端点来细分和理解你的交互。
  11. 用于编辑可伸缩矢量图形(SVG)文件的工具。与其他编辑器不同,它直接表示SVG代码,不添加任何元数据,并允许实时编辑SVG代码。其主要特色在于实时交互式SVG编辑,优化的SVG输出以及移动设备可访问性。

    GodSVG | #工具