黑洞资源笔记

16:11 · Feb 26, 2025 · Wed

VaViM and VaVAM：通过视频生成建模实现自动驾驶的创新方案。

提供从感知到行动的完整自动驾驶解决方案；预训练模型参数规模从185M到1.2B，满足不同需求；在多个基准测试中表现出色，助力自动驾驶研究。

16:09 · Feb 26, 2025 · Wed

类似于 git 的知识管理工具，它允许用户将本地文件转换为知识库，并支持知识库的克隆、推送等操作，旨在简化知识库的创建和共享过程。核心价值：轻松创建和分享知识库。

支持多轮对话查询，知识检索更智能；使用TF-IDF替代向量搜索，精准度更高；支持Markdown文件和图片，内容更丰富。

RAGIT | #工具

工具

16:07 · Feb 26, 2025 · Wed

MHA2MLA：旨在通过实现 DeepSeek 的多头潜在注意力机制（MLA），使任何基于 Transformer 的大型语言模型（LLM）的推理过程更加经济高效。

经济推理，显著降低GPU内存占用；支持多种Transformer架构，适配性强；结合FlashMLA框架，理论内存节省可达80%以上

16:06 · Feb 26, 2025 · Wed

一个为机器学习研究量身定制的GitHub模板，帮助研究人员快速搭建高效、规范的项目架构。

提供详尽的文档和示例代码，轻松上手；支持云日志和自动检查点保存，方便实验管理；集成Slurm集群支持，简化分布式训练流程。

research-template | #模板

模板

16:03 · Feb 26, 2025 · Wed

为懒惰开发者设计的Rust Web框架，让Web开发变得轻松又高效。

类似Django的易用API，快速上手；内置ORM，自动管理数据库迁移；提供开箱即用的Admin面板，简化数据管理

cot-rs/cot | #框架

框架

16:01 · Feb 26, 2025 · Wed

摩根士丹利发布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》报告，详细介绍了人形机器人市场的全球生态、参与公司、技术分解、投资案例以及未来发展趋势

Morgan Stanley 发布的这份报告，通过对人形机器人领域的全球映射，提供了一个由 100 家公司组成的清单，这些公司涉及到人形机器人的生产和相关技术的提供。

报告将这些公司分为三个主要类别：大脑（Brain）、身体（Body）和集成商（Integrators）。

大脑部分包括提供基础模型、数据科学与分析、模拟与视觉软件、视觉和计算半导体、内存、半导体设计以及制造等公司。

身体部分涉及到传感器、电池、模拟半导体、身体、线束、热管理以及分布式自动化等。

集成商则是那些正在构建完整人形机器人或有潜力构建的公司。报告还分析了人形机器人的投资案例、市场潜力、成本结构以及未来的增长潜力。

此外，报告还提供了对人形机器人不同部件的深入剖析，以及对人形机器人技术进展对劳动力市场的潜在影响。

The_Humanoid_100_-_Mapping_the_Humanoid_Robot_Value_Chain.pdf

4.5 MB

15:32 · Feb 26, 2025 · Wed

提升Grok-3等大模型交互效率和效果的提示词工程技巧。

在评论区

15:32 · Feb 26, 2025 · Wed

最全面的AI应用安全攻击指南，涵盖了对当前 AI 模型的理解、如何使用和操控它们，以及详细的 AI 攻击场景。

文章深入探讨了 AI 应用的攻击场景，包括了解和应对提示注入攻击的重法，以及 AI 应用的责任模型。

责任模型划分了模型提供者、应用开发者和用户在安全性方面的职责分担。作者详细列举了多种 AI 应用的攻击场景，包括传统的安全漏洞、提示注入漏洞实例、其他 AI 安全漏洞、AI 信任和安全缺陷、多模态提示注入实例以及隐藏的提示注入实例。

文章还提供了针对 AI 漏洞的缓解策略，包括系统提示调整、输入过滤、角色基于的访问控制（RBAC）和沙盒隔离等。此外，作者还提供了针对 AI 应用的渗透测试方法论，包括识别数据源、查找数据泄露路径、利用传统的 Web 漏洞以及渗透测试 AI 安全和多模态漏洞。最后，文章提供了一些针对 AI 相关漏洞的 Bug Bounty 技巧，强调了清晰定义漏洞影响、与责任模型保持一致以及提供清晰的攻击示例的重要性。

从基础到高级，涵盖AI模型理解、攻击场景分析，提供大量实战案例，包括传统漏洞触发和多模态攻击，提供详细防御策略，帮助开发者加固应用。

AI Hacking Guide | #指南

指南

15:26 · Feb 26, 2025 · Wed

DeepGEMM：DeepSeek开源的高效且简洁的FP8矩阵乘法（GEMM）库，为深度学习加速而生。

性能卓越，部分场景速度提升高达2.7倍；代码简洁，核心功能仅约300行代码；支持混合专家模型（MoE），适配多种矩阵形状

15:24 · Feb 26, 2025 · Wed

SlamKit：专门为了提高语音语言模型训练效率而设计的开源工具包，支持使用一个 GPU 在一天内完成模型训练。

仅需1个GPU，1天内完成语音语言模型训练；支持多种语音特征提取和预训练方案；提供完整的训练、评估和偏好对齐流程

15:22 · Feb 26, 2025 · Wed

HOVER：为机器人运动控制提供高效、灵活的神经网络解决方案。

基于强化学习，实现复杂动作的精准控制；支持多种机器人模型，适配性强；提供详细的训练和测试流程，易于上手

15:19 · Feb 26, 2025 · Wed

Cloudflare Agents：在Cloudflare上构建和部署AI Agent，让Agent在边缘网络中持久化、思考和进化。

实时WebSocket通信，低延迟交互；核心框架支持状态管理，持久化能力强大；提供React集成钩子，开发体验更流畅

15:18 · Feb 26, 2025 · Wed

CockroachDB Swiss：Go语言实现的高性能哈希表，为大规模数据处理提供极致性能。

性能卓越，大尺寸哈希表性能提升高达60%以上；内存分配优化，显著降低内存使用；支持伪随机迭代和增量扩容，减少尾延迟

15:16 · Feb 26, 2025 · Wed

Awesome-Open-Vocabulary-Perception：一个超酷的开源项目，汇集了最新的开放词汇感知技术（涵盖2D和3D）的论文和代码。

涵盖3D和2D两大领域，资源丰富；提供了10多篇顶级会议论文及代码链接；持续更新，助力研究人员快速上手

15:15 · Feb 26, 2025 · Wed

AI Agent开发与协同框架，从单模型推理到多代理系统，轻松构建复杂AI应用。

支持多种模型和工具集成；动态路由输入至合适代理，灵活高效；提供9个分支和10个版本，助力开发者快速上手

AgentKit | #框架

框架

15:13 · Feb 26, 2025 · Wed

DeepSeek R1：介绍了如何从头构建 DeepSeek R1 模型，包括使用 Qwen 作为基础模型，应用 GRPO 算法进行初步训练，以及通过 Supervised Fine-Tuning (SFT) 和改进的强化学习方法提升模型的推理能力和语言一致性。

从基础模型到推理模型，全流程代码实现；使用GRPO算法优化推理能力，效率提升显著；提供详细的训练过程和手绘流程图，小白也能轻松上手