usls:一个集成ONNXRuntime的Rust库,提供丰富的计算机视觉和视觉语言模型。

支持多种硬件加速,包括CPU、CUDA、TensorRT和CoreML;提供超过30种预训练模型,涵盖YOLO系列、SAM系列等;易于使用的数据加载和可视化工具,简化开发流程
Dia-TTS-Server:自托管强大的Dia TTS模型,让文本到语音的转换更加智能和高效。

提供用户友好的Web UI,操作简单便捷;支持SafeTensors/BF16,显著降低内存占用,提升运行效率;语音克隆和对话生成功能强大,可生成自然流畅的多角色对话
一款强大的语言学习浏览器扩展,让阅读外语文本变得轻松。

支持多种语言,覆盖日语、中文、韩语等;提供互动式弹出窗口,快速显示词汇释义;自动与Anki集成,助力高效记忆

Yomitan | #扩展
为遥感领域打造的视觉语言数据集,助力AI模型更好地理解遥感图像。

超过130万张遥感图像,每张图像配备多个描述性标题;利用大型语言模型(LLM)自动生成高质量标注,减少人工标注成本;数据覆盖美国全境,图像分辨率高达0.6米

RSTeller |#数据集
Critical-Tokens-Matter:通过识别和替换关键Token,显著提升大型语言模型的推理能力。

提高模型推理准确率,如在GSM8K和MATH500数据集上表现卓越;支持多种主流模型,如Llama-3和Qwen2.5;提供完整的训练和评估流程,助力研究和开发
一款强大的文件解析工具,专为AI和LLMs设计,能将代码库和网页内容转化为适合AI处理的格式。

支持多种文件类型和网页爬取;提供代码压缩功能,减少token使用;自动估算VRAM需求,确保模型兼容性

Ingest |#工具
LLMProc:为语言模型打造的“操作系统”,让模型像进程一样协同工作,解决复杂任务

支持多模型协同,实现强大的I/O管理;提供15次提交的丰富功能,涵盖程序链接、分叉工具和时间旅行;支持OpenAI、Anthropic和Google Gemini等主流模型。
MedDr:医疗领域的多模态通用基础模型,为医疗数据处理提供一站式解决方案。

能处理多种医疗数据模态,如放射学、病理学、皮肤科、视网膜成像和内窥镜;基于诊断引导的引导式学习,提升医疗视觉语言学习效率;提供完整的代码和模型支持,助力医疗AI研究
从学术论文到海报的开源多Agent自动化生成工具。

一键将论文转换为专业海报,效率提升显著;支持多种模型组合,灵活适配不同需求;提供完整的评估体系,确保生成质量

Paper2Poster | #工具
Back to Top