黑洞资源笔记

06:17 · Jun 1, 2025 · Sun

DeepTeam：为大语言模型（LLM）系统提供红队测试框架，轻松发现潜在安全漏洞。

40+种预设漏洞检测，涵盖偏见、PII泄漏等；10+种攻击方法，支持单轮和多轮对话测试；支持自定义漏洞和攻击，5行代码即可适配企业需求

06:15 · Jun 1, 2025 · Sun

一款强大的工具，用于从Dify Marketplace和GitHub下载并重新打包Dify插件，生成真正的离线包。

支持跨平台打包，适配多种操作系统；提供详细的使用指南和示例，易于上手；灵活的配置选项，满足不同用户需求

Dify Plugin Repackaging | #工具

工具

06:10 · Jun 1, 2025 · Sun

lilaq：用Typst实现高级数据可视化的强大工具 | #工具

支持多种复杂图表，如轮廓图、向量场图等；提供丰富的样式定制选项，满足个性化需求；文档完善，提供大量示例和教程，上手容易

工具

06:09 · Jun 1, 2025 · Sun

Triton-Ascend：为昇腾平台量身定制的深度学习编译器，让Triton代码在昇腾硬件上高效运行。

支持Python wheel快速安装，部署更便捷；提供详细的安装手册和示例代码，新手友好；兼容主流深度学习框架，无缝对接现有项目

06:08 · Jun 1, 2025 · Sun

开源移动应用监控工具，连接用户行为、应用事件、网络调用、日志和错误，让生产环境中的问题调试变得轻松。

支持Android和iOS两大平台；提供完整的会话时间线，自动追踪用户点击、导航事件等；自托管，数据完全私有

Measure | #工具

工具

06:06 · Jun 1, 2025 · Sun

A visual introduction to vector embeddings：通过可视化的方式深入理解向量嵌入模型。

提供了多种向量嵌入模型（如word2vec、text-embedding-ada-002等）的直观对比；详细解释了向量相似性度量方法（如余弦相似度、点积等）；探讨了向量压缩技术，帮助优化存储和计算效率

06:04 · Jun 1, 2025 · Sun

给程序员的提示词工程实战手册：为开发者提供AI编程助手的高效使用指南。| #手册

提供丰富的代码调试、优化和新功能实现的实用技巧；通过具体示例展示如何将AI工具打造成可靠的开发伙伴；涵盖从基础到高级的提示工程策略，助力开发者提升效率

手册

05:47 · Jun 1, 2025 · Sun

一款强大的工具，用于发现和可视化神经网络中的回路（circuits）和归因图。

支持跨层MLP转码器，能够精准定位模型内部的因果关系；提供交互式可视化界面，便于理解和标注特征；支持多种模型，包括Gemma和Llama，适用范围广泛

Circuit Tracer | #工具

工具

05:44 · Jun 1, 2025 · Sun

ROLL：阿里巴巴推出的高效强化学习库，专为大规模语言模型训练而设计。

支持高达2000亿参数模型的分布式训练；提供超过350种预训练模型和任务支持；优化后的训练成本降低50%以上

05:41 · Jun 1, 2025 · Sun

MiMo-VL：小米推出的强大视觉语言模型，助力复杂推理与多模态任务。

采用原生分辨率ViT编码器，保留精细视觉细节；通过四阶段预训练和混合策略强化学习，性能大幅提升；在多模态推理任务中超越开源基线模型，表现卓越

05:38 · Jun 1, 2025 · Sun

Darwin Gödel Machine (DGM)：一个能够自我进化的代码改进系统，通过迭代修改自身代码来提升性能，解决代码优化难题。

自我改进能力，代码越改越好；基于SWE-bench和Polyglot基准测试验证改进效果；初始版本已展现出显著的性能提升

05:37 · Jun 1, 2025 · Sun

AI Fluency：Anthropic最新发布一门免费在线课程，旨在帮助用户有效、安全、道德地与大型语言模型协作。

课程基于Dakan和Feller的AI Fluency框架，聚焦“4D”核心能力：Delegation（任务分配）、Description（清晰沟通）、Discernment（审慎评估）和Diligence（负责任使用）。

它探讨了三种AI协作方式：Automation（自动化）、Augmentation（增强）和Agency（代理），强调通过实践技能和思维转变，建立持久的AI协作能力。

课程时长约3-4小时，适合各领域用户，鼓励通过与Claude或其他AI模型的互动练习，提升跨平台AI应用能力

05:25 · Jun 1, 2025 · Sun

AI Agent提示词设计（Prompting）的关键技术：

提供超具体和详细的指令，明确角色、任务和输出格式；
通过角色设定和任务分解增强LLM的表现；
使用结构化提示（如Markdown或XML）定义输入输出；
让LLM自我优化提示；
提供少样本或上下文学习示例；
设计动态提示生成更专业输出；
设置“逃生机制”以应对未知情况；
要求LLM提供调试信息以改进提示；
重视测试用例评估提示效果；
根据模型特性和需求调整提示风格。这些方法能显著提升LLM的可靠性和效率。