多模态模型

多模态模型是能够处理来自多种模态(包括图片、视频和文本)的信息的模型。