FullFront:面向多模态大语言模型(MLLM)的前端工程全流程基准测试平台,覆盖设计、理解与代码生成三大核心任务。
• Webpage Design:评估模型对视觉元素组织与结构规划能力
• Webpage Perception QA:检测模型对页面视觉布局、元素特性及空间关系的理解深度
• Webpage Code Generation:考察模型将视觉设计精准转化为功能性代码的水平
• 支持Claude、OpenAI、Gemini等主流多模态模型的性能评测
• 完整代码生成与评估流水线,包含图像相似度与代码质量多维度指标
• 自动将生成HTML渲染成图像,方便直观比对与打分
• 提供丰富脚本,支持批量多模型响应生成与自动化评估
• 评测结果涵盖CLIP语义相似度、代码结构及内容相似度,帮助深入解析模型表现
FullFront为多模态前端AI能力的系统化评估提供了坚实工具,助力推动前端智能化的精准测量与持续优化。