【东吴传媒互联网张良卫团队】多模态大模型或加速突破，打开AIGC产业想象空间

事件：微软2/28发布了研究论文Language Is Not All You Need: Aligning Perception with Language Models（语言不是你所需要的全部：将感知与语言模型相结合），引入了称为KOSMOS-1的多模式大型语言模型 (MLLM)。

KOSMOS-1主干是一个基于Transformer的因果语言模型。除了自然语言任务，该模型能够原生处理广泛的感知密集型任务，如视觉对话、视觉解释、视觉问答、图像字幕、简单的数学方程式、OCR 和带描述的零样本图像分类。

观点重申：

Chatgpt不仅仅能提供“文本生成”功能，在进行微调下即可具备灵活的模型自定义功能，能符合不同行业的业务特性。通过模型训练，帮助AI在专业化的行业领域理解特定的语言，以精准满足企业的个性化需求，提升企业效率。

我们认为生成式大模型在图片、视频等内容形态上的突破将各行各业产生更加深刻的影响，微软MLLM模型的发布以及OPENAI预计今年发布的GPT4.0有望加速多模态领域加速，孵化更大的产业机会！投资机会上，看好多模态大模型发展为营销行业带来新的行业红利（内容即流量）和降本增效空间。

标的上，建议关注受益于多模态大模型发展的相关上游企业：当虹科技、网达软件、海康威视、大华股份；营销标的：蓝色光标、利欧股份。此外，与ChatGPT有合作或直接相关的企业、基于大模型开发的AIGC应用场景、具有相关大模型或算法能力等相关标的我们亦持续看好。

风险提示：ChatGPT技术发展不完善、应用不及预期；AI基础设施不及预期；AI伦理风险等

联系人：张良卫/周良玖/郭若娜

作者:乌龟流 | 分类:调研纪要 | 浏览:1127 | 评论:0

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

乌龟流