整个流程非常简单,也没有复杂的地方,相信关注GPT领域的都会看到过如上的流程。
主要就以下几个点:
将本地答案数据集,转为向量存储到向量数据
当用户输入查询的问题时,把问题转为向量然后从向量数据库中查询相近的答案topK 这个时候其实就是我们最普遍的问答查询方案,在没有GPT的时候就直接返回相关的答案整个流程就结束了
现在有GPT了可以优化回答内容的整体结构,在单纯的搜索场景下其实这个优化没什么意义。但如果在客服等的聊天场景下,引用相关领域内容回复时,这样就会显得不那么的突兀。
作者打算以此做一个基于默沙东诊疗手册的问诊AI。