医学数据分析往往涉及大量复杂的多变量时序和文本信息,传统模型难以同时理解和推理这些多模态数据。
OpenTSLM 是斯坦福团队开源的时间序列语言模型项目,创新性地将时序数据作为原生输入模态,融合预训练大语言模型,实现对多变量医疗时序和文本数据的自然语言推理。
它可以处理任意长度的多条时序数据,自动生成诊断结论、数据解读和推理过程,支持睡眠阶段判别、心电问答、人类活动识别等多种任务。
主要特点:
- 原生支持多变量时序与文本的联合推理;
- 多阶段课程式训练,提升模型在医疗时序任务的表现;
- 兼容主流大语言模型(如Llama、Gemma);
- 开放源码,方便研究者复现和扩展;
- 提供详细示例和完整训练流程。
适合医学AI研究者、数据科学家和数字健康领域开发者使用,助力医疗时序数据智能分析与临床辅助决策。