黑洞资源笔记

15:32 · Apr 12, 2024 · Fri

LLM Gateway：用于安全可靠地与 OpenAI 和其他 LLM(语言模型)提供商进行通信的网关
15:30 · Apr 12, 2024 · Fri

Parler-TTS：开源的轻量级文本到语音（TTS）模型，可以生成高质量、自然流畅的语音，模仿给定的演讲者（性别、音高、说话风格等
15:25 · Apr 12, 2024 · Fri

Data-Speech：用于标注语音数据集的实用脚本套件，旨在为基于语音的人工智能模型（如文本到语音引擎）开发过程中所需要的音频变换（或注释）提供简洁、干净的代码库
15:23 · Apr 12, 2024 · Fri

Red-Teaming Language Models with DSPy：介绍了使用 DSPy 框架对语言模型进行红队攻击的尝试，展示了用 DSPy 编译后的架构效果
15:21 · Apr 12, 2024 · Fri

OmniFusion：高级的多模态 AI 模型，旨在通过集成其他数据模态（如图像、音频、3D 和视频内容）来扩展传统语言处理系统的功能。

开源 OmniFusion 核心是 Mistral-7B。该模型有两个版本：第一个使用一个视觉编码器 CLIP-ViT-L，第二个使用两个编码器（CLIP-ViT-L 和 Dino V2）。最初专注于图像，我们选择 CLIP-ViT-L 作为视觉编码器，因为它具有高效的信息传输能力。

OmniFusion 最重要的组件是它的适配器，这是一种允许语言模型解释和合并来自不同模式的信息的机制。对于单编码器版本，适配器是单层四头变压器层，与更简单的线性层或 MLP 结构相比，它表现出了卓越的性能。具有两个编码器的模型使用一个适配器，该适配器从视觉编码器的所有层收集特征，该适配器没有注意层。

该适配器从视觉编码器（不包括 CLS 令牌）获取嵌入，并将它们映射到与语言模型兼容的文本嵌入。
15:17 · Apr 12, 2024 · Fri

用于评估语言模型准确性的轻量库，包含多个评估，如 MMLU、MATH、GPQA、DROP、MGSM 和 HumanEval，并为 OpenAI 和 Anthropic API 提供了采样接口 | github
15:15 · Apr 12, 2024 · Fri

Next.js AI Chatbot：由 Vercel 和 Next.js 团队成员构建的生成式 UI 聊天机器人模板，基于 Vercel AI SDK 和 Google Gemini
15:13 · Apr 12, 2024 · Fri

SDFX：通过漂亮界面构建和分享AI应用的无代码平台

特征
在复杂的工作流程之上构建和共享用户友好的应用程序
100% 兼容 ComfyUI 及其所有功能
可以与你现有的 Comfy 安装一起使用（使用我们的 SDFXBridgeForComfy 自定义节点）
LiteGraph 几乎在打字稿中从头开始重构
动画图导航
节点书签和高级图形搜索
闪电般快速的 UI 实例化和漂亮的高级组件（比 Gradio 快 450 倍）
UI 调试器（目前还处于初级阶段）
本机自定义节点管理器（感谢 Dr.Lt.Data）
导出并共享应用程序和模板（组节点即将导出）
高级基于图层的图像和蒙版编辑器 (WIP)
高级检查点选择器和图库
高级输入图像选择器
现代且超快速的前端堆栈（vitejs、vuejs、电子）
编译为本机应用程序（Windows、Linux、Mac）或 Web 应用程序
非常容易维护和添加新功能
15:10 · Apr 12, 2024 · Fri

PCToolkit: 统一的即插即用大语言模型提示压缩工具包
15:03 · Apr 12, 2024 · Fri

Narwhals：轻量可扩展的数据框架兼容层，支持 Polars、pandas、cuDF、Modin 等多种数据框架
04:11 · Apr 10, 2024 · Wed

微博热搜：暴雪官方宣布与网易达成协议回归中国市场
14:48 · Apr 9, 2024 · Tue

谢公子-域渗透攻防 1-6章
08:16 · Apr 9, 2024 · Tue

答辩稿