黑洞资源笔记
01:06 · May 30, 2025 · Fri
usls
:一个集成ONNXRuntime的Rust库,提供丰富的计算机视觉和视觉语言模型。
支持多种硬件加速,包括CPU、CUDA、TensorRT和CoreML;提供超过30种预训练模型,涵盖YOLO系列、SAM系列等;易于使用的数据加载和可视化工具,简化开发流程
01:04 · May 30, 2025 · Fri
Dia-TTS-Server
:自托管强大的Dia TTS模型,让文本到语音的转换更加智能和高效。
提供用户友好的Web UI,操作简单便捷;支持SafeTensors/BF16,显著降低内存占用,提升运行效率;语音克隆和对话生成功能强大,可生成自然流畅的多角色对话
01:03 · May 30, 2025 · Fri
一款强大的语言学习浏览器扩展,让阅读外语文本变得轻松。
支持多种语言,覆盖日语、中文、韩语等;提供互动式弹出窗口,快速显示词汇释义;自动与Anki集成,助力高效记忆
Yomitan
|
#扩展
扩展
01:00 · May 30, 2025 · Fri
为遥感领域打造的视觉语言数据集,助力AI模型更好地理解遥感图像。
超过130万张遥感图像,每张图像配备多个描述性标题;利用大型语言模型(LLM)自动生成高质量标注,减少人工标注成本;数据覆盖美国全境,图像分辨率高达0.6米
RSTeller
|
#数据集
数据集
00:57 · May 30, 2025 · Fri
Critical-Tokens-Matter
:通过识别和替换关键Token,显著提升大型语言模型的推理能力。
提高模型推理准确率,如在GSM8K和MATH500数据集上表现卓越;支持多种主流模型,如Llama-3和Qwen2.5;提供完整的训练和评估流程,助力研究和开发
00:56 · May 30, 2025 · Fri
一款强大的文件解析工具,专为AI和LLMs设计,能将代码库和网页内容转化为适合AI处理的格式。
支持多种文件类型和网页爬取;提供代码压缩功能,减少token使用;自动估算VRAM需求,确保模型兼容性
Ingest
|
#工具
工具
00:54 · May 30, 2025 · Fri
LLMProc
:为语言模型打造的“操作系统”,让模型像进程一样协同工作,解决复杂任务
支持多模型协同,实现强大的I/O管理;提供15次提交的丰富功能,涵盖程序链接、分叉工具和时间旅行;支持OpenAI、Anthropic和Google Gemini等主流模型。
00:45 · May 30, 2025 · Fri
MedDr
:医疗领域的多模态通用基础模型,为医疗数据处理提供一站式解决方案。
能处理多种医疗数据模态,如放射学、病理学、皮肤科、视网膜成像和内窥镜;基于诊断引导的引导式学习,提升医疗视觉语言学习效率;提供完整的代码和模型支持,助力医疗AI研究
00:42 · May 30, 2025 · Fri
从学术论文到海报的开源多Agent自动化生成工具。
一键将论文转换为专业海报,效率提升显著;支持多种模型组合,灵活适配不同需求;提供完整的评估体系,确保生成质量
Paper2Poster
|
#工具
工具
Before
After
Home
Powered by
BroadcastChannel
&
Sepia