将自然语言提示转化为个性化排行榜的AI工具，用于评估大型语言模型（LLM）性能，能生成针对特定提示或提示集合的排行榜，以揭示用户和提示特定的模型表现变化

将自然语言提示转化为个性化排行榜的AI工具，用于评估大型语言模型（LLM）性能，能生成针对特定提示或提示集合的排行榜，以揭示用户和提示特定的模型表现变化。

提供基于提示的模型性能评估，精准捕捉模型优劣；实现任务特定的自动化评估，助力模型优化；支持OpenAI兼容路由，高效分配查询到最优模型

Prompt-to-Leaderboard（P2L）| #工具