VaViM and VaVAM:通过视频生成建模实现自动驾驶的创新方案。

提供从感知到行动的完整自动驾驶解决方案;预训练模型参数规模从185M到1.2B,满足不同需求;在多个基准测试中表现出色,助力自动驾驶研究。
类似于 git 的知识管理工具,它允许用户将本地文件转换为知识库,并支持知识库的克隆、推送等操作,旨在简化知识库的创建和共享过程。核心价值:轻松创建和分享知识库。

支持多轮对话查询,知识检索更智能;使用TF-IDF替代向量搜索,精准度更高;支持Markdown文件和图片,内容更丰富。

RAGIT | #工具
MHA2MLA:旨在通过实现 DeepSeek 的多头潜在注意力机制(MLA),使任何基于 Transformer 的大型语言模型(LLM)的推理过程更加经济高效。

经济推理,显著降低GPU内存占用;支持多种Transformer架构,适配性强;结合FlashMLA框架,理论内存节省可达80%以上
一个为机器学习研究量身定制的GitHub模板,帮助研究人员快速搭建高效、规范的项目架构。

提供详尽的文档和示例代码,轻松上手;支持云日志和自动检查点保存,方便实验管理;集成Slurm集群支持,简化分布式训练流程。

research-template | #模板
为懒惰开发者设计的Rust Web框架,让Web开发变得轻松又高效。

类似Django的易用API,快速上手;内置ORM,自动管理数据库迁移;提供开箱即用的Admin面板,简化数据管理

cot-rs/cot | #框架
摩根士丹利发布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》报告,详细介绍了人形机器人市场的全球生态、参与公司、技术分解、投资案例以及未来发展趋势

Morgan Stanley 发布的这份报告,通过对人形机器人领域的全球映射,提供了一个由 100 家公司组成的清单,这些公司涉及到人形机器人的生产和相关技术的提供。

报告将这些公司分为三个主要类别:大脑(Brain)、身体(Body)和集成商(Integrators)。

大脑部分包括提供基础模型、数据科学与分析、模拟与视觉软件、视觉和计算半导体、内存、半导体设计以及制造等公司。

身体部分涉及到传感器、电池、模拟半导体、身体、线束、热管理以及分布式自动化等。

集成商则是那些正在构建完整人形机器人或有潜力构建的公司。报告还分析了人形机器人的投资案例、市场潜力、成本结构以及未来的增长潜力。

此外,报告还提供了对人形机器人不同部件的深入剖析,以及对人形机器人技术进展对劳动力市场的潜在影响。
The_Humanoid_100_-_Mapping_the_Humanoid_Robot_Value_Chain.pdf
4.5 MB
提升Grok-3等大模型交互效率和效果的提示词工程技巧。

在评论区
最全面的AI应用安全攻击指南,涵盖了对当前 AI 模型的理解、如何使用和操控它们,以及详细的 AI 攻击场景。

文章深入探讨了 AI 应用的攻击场景,包括了解和应对提示注入攻击的重法,以及 AI 应用的责任模型。

责任模型划分了模型提供者、应用开发者和用户在安全性方面的职责分担。作者详细列举了多种 AI 应用的攻击场景,包括传统的安全漏洞、提示注入漏洞实例、其他 AI 安全漏洞、AI 信任和安全缺陷、多模态提示注入实例以及隐藏的提示注入实例。

文章还提供了针对 AI 漏洞的缓解策略,包括系统提示调整、输入过滤、角色基于的访问控制(RBAC)和沙盒隔离等。此外,作者还提供了针对 AI 应用的渗透测试方法论,包括识别数据源、查找数据泄露路径、利用传统的 Web 漏洞以及渗透测试 AI 安全和多模态漏洞。最后,文章提供了一些针对 AI 相关漏洞的 Bug Bounty 技巧,强调了清晰定义漏洞影响、与责任模型保持一致以及提供清晰的攻击示例的重要性。

从基础到高级,涵盖AI模型理解、攻击场景分析,提供大量实战案例,包括传统漏洞触发和多模态攻击,提供详细防御策略,帮助开发者加固应用。

AI Hacking Guide | #指南
DeepGEMM:DeepSeek开源的高效且简洁的FP8矩阵乘法(GEMM)库,为深度学习加速而生。

性能卓越,部分场景速度提升高达2.7倍;代码简洁,核心功能仅约300行代码;支持混合专家模型(MoE),适配多种矩阵形状
SlamKit:专门为了提高语音语言模型训练效率而设计的开源工具包,支持使用一个 GPU 在一天内完成模型训练。

仅需1个GPU,1天内完成语音语言模型训练;支持多种语音特征提取和预训练方案;提供完整的训练、评估和偏好对齐流程
HOVER:为机器人运动控制提供高效、灵活的神经网络解决方案。

基于强化学习,实现复杂动作的精准控制;支持多种机器人模型,适配性强;提供详细的训练和测试流程,易于上手
Cloudflare Agents:在Cloudflare上构建和部署AI Agent,让Agent在边缘网络中持久化、思考和进化。

实时WebSocket通信,低延迟交互;核心框架支持状态管理,持久化能力强大;提供React集成钩子,开发体验更流畅
CockroachDB Swiss:Go语言实现的高性能哈希表,为大规模数据处理提供极致性能。

性能卓越,大尺寸哈希表性能提升高达60%以上;内存分配优化,显著降低内存使用;支持伪随机迭代和增量扩容,减少尾延迟
Awesome-Open-Vocabulary-Perception:一个超酷的开源项目,汇集了最新的开放词汇感知技术(涵盖2D和3D)的论文和代码。

涵盖3D和2D两大领域,资源丰富;提供了10多篇顶级会议论文及代码链接;持续更新,助力研究人员快速上手
AI Agent开发与协同框架,从单模型推理到多代理系统,轻松构建复杂AI应用。

支持多种模型和工具集成;动态路由输入至合适代理,灵活高效;提供9个分支和10个版本,助力开发者快速上手

AgentKit | #框架
DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Supervised Fine-Tuning (SFT) 和改进的强化学习方法提升模型的推理能力和语言一致性。

从基础模型到推理模型,全流程代码实现;使用GRPO算法优化推理能力,效率提升显著;提供详细的训练过程和手绘流程图,小白也能轻松上手
Back to Top