一款辅助轻松阅读论文的开源工具 | arXiv-txt.org | #工具

只需将论文链接中的 "arxiv.org" 替换为 "arxiv-txt.org",即可获得一份摘要以及论文 PDF 文件内容。支持快速部署到 Vercel,并提供完整 API 接口使用
阿里千问上线了基于QwQ-Max的推理大模型QwQ-Max-Preview,可以“深度思考”,支持联网,为智能对话和多领域任务提供强大支持。

数学理解能力强,轻松应对复杂计算;编程能力出色,助力开发者高效编程;创造力大幅提升,相比Qwen2.5-Max更智能
DeepEP:DeepSeek最新开源的高效专家并行通信库,提供了高吞吐、低延迟的 GPU 内核,支持低精度操作,并且与 DeepSeek-V3 论文中提出的组限制门控算法相匹配,为大规模分布式AI模型训练和推理加速。

提供高吞吐、低延迟的GPU通信内核,性能提升显著;支持低精度操作(如FP8),优化计算效率;低延迟内核延迟低至163微秒,适合推理解码场景
R1-Onevision:一款能够深度推理的多模态视觉语言模型,专门针对深层次的视觉推理任务,能处理复杂的图像和文本数据,让复杂视觉问题迎刃而解。

超强多模态推理能力,超越GPT-4o;高质量数据集,涵盖数学、科学、图像理解等多领域;提供7B模型权重,推理性能卓越。
集成在终端中的智能编程工具,能理解代码库,通过自然语言命令帮助开发者快速执行常规任务、解释复杂代码和处理 Git 工作流程。

理解代码库,帮你快速执行常规任务;解释复杂代码,让晦涩难懂的代码瞬间清晰;处理Git工作流,从冲突解决到PR创建,全搞定。

Claude Code (Research Preview) | #工具
学术调研自动化工具,利用大型语言模型快速生成高质量学术综述。

输入标题和关键词即可生成综述;提供30+示例论文;支持多领域文献检索。

SurveyX | #工具
一个强大的OCR基准测试工具,帮助你快速评估不同多模态模型的OCR和数据提取能力,轻松找到最适合你的模型。

支持多种主流模型,如gpt-4o和Gemini;提供详细的JSON准确率和文本相似度评估;开源数据集,可自由扩展和定制。

Omni OCR Benchmark | #工具
VaViM and VaVAM:通过视频生成建模实现自动驾驶的创新方案。

提供从感知到行动的完整自动驾驶解决方案;预训练模型参数规模从185M到1.2B,满足不同需求;在多个基准测试中表现出色,助力自动驾驶研究。
类似于 git 的知识管理工具,它允许用户将本地文件转换为知识库,并支持知识库的克隆、推送等操作,旨在简化知识库的创建和共享过程。核心价值:轻松创建和分享知识库。

支持多轮对话查询,知识检索更智能;使用TF-IDF替代向量搜索,精准度更高;支持Markdown文件和图片,内容更丰富。

RAGIT | #工具
MHA2MLA:旨在通过实现 DeepSeek 的多头潜在注意力机制(MLA),使任何基于 Transformer 的大型语言模型(LLM)的推理过程更加经济高效。

经济推理,显著降低GPU内存占用;支持多种Transformer架构,适配性强;结合FlashMLA框架,理论内存节省可达80%以上
一个为机器学习研究量身定制的GitHub模板,帮助研究人员快速搭建高效、规范的项目架构。

提供详尽的文档和示例代码,轻松上手;支持云日志和自动检查点保存,方便实验管理;集成Slurm集群支持,简化分布式训练流程。

research-template | #模板
Back to Top