黑洞资源笔记

05:16 · Mar 1, 2025 · Sat

一款辅助轻松阅读论文的开源工具 | arXiv-txt.org | #工具

只需将论文链接中的 "arxiv.org" 替换为 "arxiv-txt.org"，即可获得一份摘要以及论文 PDF 文件内容。支持快速部署到 Vercel，并提供完整 API 接口使用

工具

16:22 · Feb 26, 2025 · Wed

阿里千问上线了基于QwQ-Max的推理大模型QwQ-Max-Preview，可以“深度思考”，支持联网，为智能对话和多领域任务提供强大支持。

数学理解能力强，轻松应对复杂计算；编程能力出色，助力开发者高效编程；创造力大幅提升，相比Qwen2.5-Max更智能

16:21 · Feb 26, 2025 · Wed

DeepEP：DeepSeek最新开源的高效专家并行通信库，提供了高吞吐、低延迟的 GPU 内核，支持低精度操作，并且与 DeepSeek-V3 论文中提出的组限制门控算法相匹配，为大规模分布式AI模型训练和推理加速。

提供高吞吐、低延迟的GPU通信内核，性能提升显著；支持低精度操作（如FP8），优化计算效率；低延迟内核延迟低至163微秒，适合推理解码场景

16:19 · Feb 26, 2025 · Wed

R1-Onevision：一款能够深度推理的多模态视觉语言模型，专门针对深层次的视觉推理任务，能处理复杂的图像和文本数据，让复杂视觉问题迎刃而解。

超强多模态推理能力，超越GPT-4o；高质量数据集，涵盖数学、科学、图像理解等多领域；提供7B模型权重，推理性能卓越。

16:17 · Feb 26, 2025 · Wed

集成在终端中的智能编程工具，能理解代码库，通过自然语言命令帮助开发者快速执行常规任务、解释复杂代码和处理 Git 工作流程。

理解代码库，帮你快速执行常规任务；解释复杂代码，让晦涩难懂的代码瞬间清晰；处理Git工作流，从冲突解决到PR创建，全搞定。

Claude Code (Research Preview) | #工具

工具

16:15 · Feb 26, 2025 · Wed

学术调研自动化工具，利用大型语言模型快速生成高质量学术综述。

输入标题和关键词即可生成综述；提供30+示例论文；支持多领域文献检索。

SurveyX | #工具

工具

16:14 · Feb 26, 2025 · Wed

一个强大的OCR基准测试工具，帮助你快速评估不同多模态模型的OCR和数据提取能力，轻松找到最适合你的模型。

支持多种主流模型，如gpt-4o和Gemini；提供详细的JSON准确率和文本相似度评估；开源数据集，可自由扩展和定制。

Omni OCR Benchmark | #工具

工具

16:11 · Feb 26, 2025 · Wed

VaViM and VaVAM：通过视频生成建模实现自动驾驶的创新方案。

提供从感知到行动的完整自动驾驶解决方案；预训练模型参数规模从185M到1.2B，满足不同需求；在多个基准测试中表现出色，助力自动驾驶研究。

16:09 · Feb 26, 2025 · Wed

类似于 git 的知识管理工具，它允许用户将本地文件转换为知识库，并支持知识库的克隆、推送等操作，旨在简化知识库的创建和共享过程。核心价值：轻松创建和分享知识库。

支持多轮对话查询，知识检索更智能；使用TF-IDF替代向量搜索，精准度更高；支持Markdown文件和图片，内容更丰富。

RAGIT | #工具

工具

16:07 · Feb 26, 2025 · Wed

MHA2MLA：旨在通过实现 DeepSeek 的多头潜在注意力机制（MLA），使任何基于 Transformer 的大型语言模型（LLM）的推理过程更加经济高效。

经济推理，显著降低GPU内存占用；支持多种Transformer架构，适配性强；结合FlashMLA框架，理论内存节省可达80%以上

16:06 · Feb 26, 2025 · Wed

一个为机器学习研究量身定制的GitHub模板，帮助研究人员快速搭建高效、规范的项目架构。

提供详尽的文档和示例代码，轻松上手；支持云日志和自动检查点保存，方便实验管理；集成Slurm集群支持，简化分布式训练流程。

research-template | #模板

模板