黑洞资源笔记
06:25 · Mar 1, 2025 · Sat
将自然语言提示转化为个性化排行榜的AI工具,用于评估大型语言模型(LLM)性能,能生成针对特定提示或提示集合的排行榜,以揭示用户和提示特定的模型表现变化。
提供基于提示的模型性能评估,精准捕捉模型优劣;实现任务特定的自动化评估,助力模型优化;支持OpenAI兼容路由,高效分配查询到最优模型
Prompt-to-Leaderboard(P2L)
| #工具
Home
Powered by
BroadcastChannel
&
Sepia