黑洞资源笔记
-
- Samantha:自主对话Agent,具备自由思考和连续说话的能力,创造出极高的逼真感和动态性,具有以下特点:
1.动态语音,可以根据上下文自主发言,不仅限于回答问题
2.实时视觉能力,只有在相关时才直接提到和处理视觉信息,但视觉始终影响其思维和行为
3.外部分类记忆,可以动态地读写记忆,选择最相关的信息
4.每时每刻都在发展,存储在记忆中的经验可以影响和塑造Samantha的行为,包括个性、说话频率和风格等。 -
-
-
-
- SeamlessExpressive:高质量的语音到语音翻译,在翻译输出中保持原始说话者的声音风格、语气和独特的表达方式。
SeamlessExpressive模型由两个主要模块组成:(1)Prosody UnitY2,它是基于UnitY2架构的韵律感知语音到单元翻译模型;(2)PRETSSEL,它是一种具有跨语言表达性保存的单元到语音模型。