黑洞资源笔记

usls：一个集成ONNXRuntime的Rust库，提供丰富的计算机视觉和视觉语言模型。

支持多种硬件加速，包括CPU、CUDA、TensorRT和CoreML；提供超过30种预训练模型，涵盖YOLO系列、SAM系列等；易于使用的数据加载和可视化工具，简化开发流程

Dia-TTS-Server：自托管强大的Dia TTS模型，让文本到语音的转换更加智能和高效。

提供用户友好的Web UI，操作简单便捷；支持SafeTensors/BF16，显著降低内存占用，提升运行效率；语音克隆和对话生成功能强大，可生成自然流畅的多角色对话

一款强大的语言学习浏览器扩展，让阅读外语文本变得轻松。

支持多种语言，覆盖日语、中文、韩语等；提供互动式弹出窗口，快速显示词汇释义；自动与Anki集成，助力高效记忆

Yomitan | #扩展

为遥感领域打造的视觉语言数据集，助力AI模型更好地理解遥感图像。

超过130万张遥感图像，每张图像配备多个描述性标题；利用大型语言模型（LLM）自动生成高质量标注，减少人工标注成本；数据覆盖美国全境，图像分辨率高达0.6米

RSTeller |#数据集

Critical-Tokens-Matter：通过识别和替换关键Token，显著提升大型语言模型的推理能力。

提高模型推理准确率，如在GSM8K和MATH500数据集上表现卓越；支持多种主流模型，如Llama-3和Qwen2.5；提供完整的训练和评估流程，助力研究和开发

一款强大的文件解析工具，专为AI和LLMs设计，能将代码库和网页内容转化为适合AI处理的格式。

支持多种文件类型和网页爬取；提供代码压缩功能，减少token使用；自动估算VRAM需求，确保模型兼容性

Ingest |#工具

LLMProc：为语言模型打造的“操作系统”，让模型像进程一样协同工作，解决复杂任务

支持多模型协同，实现强大的I/O管理；提供15次提交的丰富功能，涵盖程序链接、分叉工具和时间旅行；支持OpenAI、Anthropic和Google Gemini等主流模型。

MedDr：医疗领域的多模态通用基础模型，为医疗数据处理提供一站式解决方案。

能处理多种医疗数据模态，如放射学、病理学、皮肤科、视网膜成像和内窥镜；基于诊断引导的引导式学习，提升医疗视觉语言学习效率；提供完整的代码和模型支持，助力医疗AI研究

从学术论文到海报的开源多Agent自动化生成工具。

一键将论文转换为专业海报，效率提升显著；支持多种模型组合，灵活适配不同需求；提供完整的评估体系，确保生成质量

Paper2Poster | #工具