在处理大语言模型(LLM)时,JSON数据虽然通用,但往往令token消耗高昂,成本不菲。

Token-Oriented Object Notation(TOON)
是一个专为LLM设计的高效序列化格式,以更紧凑的结构表达相同信息,通常能节省30%~60%的token。

TOON结合了YAML的缩进层级和CSV的表格形式,特别适合统一结构的数组对象,既保留了数据的明确定义,又大幅降低了token使用量。同时,TOON支持多种分隔符(逗号、制表符、管道符),可根据需求灵活切换,进一步提升效率。

主要特点包括:
- 结构清晰,易于LLM解析和验证
- 语法简洁,避免冗余符号
- 支持嵌套对象和表格数组
- 具备严格和宽松两种解码模式
- 提供官方TypeScript实现及CLI工具,方便集成和转换

非常适合需要大量结构化数据输入LLM的场景,如提示工程、数据传输和模型交互。
 
 
Back to Top