黑洞资源笔记

01:14 · Feb 28, 2024 · Wed

大型多模态Agents相关资源列表 | Awesome Large Multimodal Agentsa
01:11 · Feb 28, 2024 · Wed

一个包含大约100万个AI偏好的数据集，从teknium/OpenHermes-2.5中提取而来。

它结合了来自源数据集和另外两个模型Mixtral-8x7B-Instruct-v0.1和Nous-Hermes-2-Yi-34B的回答，并使用PairRM作为偏好模型对生成结果进行评分和排名。

该数据集可用于训练偏好模型或通过直接偏好优化等技术对齐语言模型。

OpenHermesPreferences | #数据集

数据集
01:09 · Feb 28, 2024 · Wed

Refined-Anime-Text：包含超过一百万条、约4400万个 GPT-4/3.5 token的、全新合成的文本数据集的动漫主题子集
01:08 · Feb 28, 2024 · Wed

Supervoice GPT：将文本转换为音素及其持续时间的GPT模型，适用于输入语音合成器
01:07 · Feb 28, 2024 · Wed

MobiLlama: 准确且轻量的全透明语言模型，旨在满足资源受限设备如手机端的需求

Ps:已被网友鉴定为垃圾
01:04 · Feb 28, 2024 · Wed

Dough v. 0.5 (beta)：用AI生成视频，允许使用图像和示例视频来精确引导视频生成，包括稳定StableDiffusion XL、IP-Adapter、Fooocus Inpainting 等
01:01 · Feb 28, 2024 · Wed

本地LLM使用指南 0.2 | #指南

LLMs，即大型语言模型（Large Language Models），是一种基于人工智能和机器学习技术构建的先进模型，旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据，掌握语言的结构、语法、语义和上下文等复杂特性，从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。

LLMs例如GPT、LLama、Mistral系列等，通过深度学习的技术架构，如Transformer，使得这些模型能够捕捉到文本之间深层次的关联和含义。模型首先在广泛的数据集上进行预训练，学习语言的一般特征和模式，然后可以针对特定的任务或领域进行微调，以提高其在特定应用中的表现。

预训练阶段让LLMs掌握了大量的语言知识和世界知识，而微调阶段则使模型能够在特定任务上达到更高的性能。这种训练方法赋予了LLMs在处理各种语言任务时的灵活性和适应性，能够为用户提供准确、多样化的信息和服务。

指南
00:56 · Feb 28, 2024 · Wed

构建你自己的 AI 辅助编码助手 | repo

介绍如何 DIY 一个端到端(从 IDE 插件、模型选型、数据集构建到模型微调)的 AI 辅助编程工具，类似于 GitHub Copilot、JetBrains AI Assistant、AutoDev 等
00:53 · Feb 28, 2024 · Wed

World's Easiest GPT-like Voice Assistant：超简单的类GPT语音助手，采用开源大型语言模型 (LLM) 以响应口头请求，完全在树莓派上本地运行。

它不需要互联网连接或云服务支持。使用按钮触发录音，经过自动语音识别生成文本，然后由 TinyLlama-1.1B LLM 生成回复，并通过 eSpeak 语音合成器产生音频输出。
00:52 · Feb 28, 2024 · Wed

SubFix是一个用于轻松地编辑修改音频字幕的网页工具。能够实时地看到改动，方便地对音频进行合并、分割、删除、编辑字幕。

SubFix同时也支持自动化语音标注，使用modelscope和whisper对文本进行多语言标注。目前modelscope支持中文、英语、日语、德语、德语、俄语的自动化标注。whisper支持几乎所有语言。

独立的.py文件版本，可以通过subfix_webui.py获取。该版本可以通过命令行参数来选择语言，支持英文和中文。同时可以选择在编辑时是否同步删除硬盘上的音频文件。

SubFix | #工具

工具
00:33 · Feb 28, 2024 · Wed

用Gemma, MongoDB 和开源模型构建RAG系统 | link
00:29 · Feb 28, 2024 · Wed

一个开源的 AI 贴纸制作工具 StickerBaker。

结合了 Stickers SDXL Lora 和 BRIA 背景移除工具，你仅需输出简单的提示词，即可快速生成一张高清精美的贴纸。

cog-stickers | #工具

工具
06:42 · Feb 27, 2024 · Tue

2024手写分布式IM系统2期
06:42 · Feb 27, 2024 · Tue

2023王道C++就业班49期
12:58 · Feb 25, 2024 · Sun

Free Design Stuff：免费设计资源集合

免费设计资源集合网站，包括免费字体、图标、插图、照片等设计素材，适用于个人和商业用途。提供各种设计工具和模板，适用于设计师和创作者。