ComfyUI-Gemini_Flash_2.0_Exp:一个强大的ComfyUI自定义节点,整合了谷歌的Gemini Flash 2.0实验模型,让你在ComfyUI工作流中直接进行文本、图像、视频帧和音频的多模态分析。

新增图像生成能力,可基于文本描述生成图像;支持语音聊天,配备智能音频录制节点;提供结构化输出选项,让分析结果更清晰易懂
为LLM驱动的Agent工作流提供深度安全扫描的工具。

可视化工作流,直观呈现Agent系统运行流程;识别并列出所有外部及自定义工具,精准定位风险点;映射工具到已知漏洞,提供全面的安全概览

Agentic Radar | #工具
DiagnosisZero:基于DeepSeek R1 Zero的罕见病诊断研究项目,助力医疗AI的精准诊断。

针对罕见病诊断任务优化,提升诊断准确率;多尺度模型探索,涵盖1.5B、3B、7B三种模型规模;自定义奖励函数,精准匹配医疗诊断需求
一款“Photoshop for text”风格的智能文本编辑器,让文字编辑像绘画一样直观。

文字可通过拖拽边缘拉伸或缩短,还能旋转调整顺序;提供“涂抹工具”“橡皮擦”“语调画笔”等独特编辑工具;支持布尔运算组合句子,解锁创意写作新方式

Textoshop | #编辑器
大规模高质量文本到SQL数据合成框架,助力高效开发文本到SQL模型。

首个百万级跨领域文本到SQL数据集SynSQL-2.5M,包含254万多样本;覆盖16583个数据库,涵盖多种SQL复杂度;提供链式思考解决方案,助力模型理解与优化

OmniSQL | #框架
SmolDocling-256M-preview:由 Docling 团队开发的高效的多模态图像文本到文本模型,专为文档转换而设计,支持多种文档处理功能,并与 Docling 文档兼容。

支持全页转换,包括代码、公式、图表等元素;快速推理,平均每页仅需0.35秒;兼容Docling,支持多种格式输出
ReasonGraph:一个开源的 Web 平台,用于可视化和分析大型语言模型的推理过程,支持多种推理方法和模型,并提供了在线演示和详细文档。

支持50+主流大语言模型,涵盖Anthropic、OpenAI、Google等;提供多种推理方法的可视化,包括序列推理和树状推理;简单易用的界面,无需复杂配置即可上手
为开发者设计的模型优化框架,能以最小的开销交付更快、更高效的模型。

提供多种压缩算法,包括缓存、量化、剪枝等;仅需几行代码即可优化模型;支持多种模型类型,如LLMs、扩散模型、视觉Transformer等

Pruna AI | #框架
Back to Top