【东吴传媒互联网 张良卫团队】多模态大模型或加速突破,打开AIGC产业想象空间
事件:微软2/28发布了研究论文Language Is Not All You Need: Aligning Perception with Language Models(语言不是你所需要的全部:将感知与语言模型相结合),引入了称为KOSMOS-1的多模式大型语言模型 (MLLM)。
KOSMOS-1主干是一个基于Transformer的因果语言模型。除了自然语言任务,该模型能够原生处理广泛的感知密集型任务,如视觉对话、视觉解释、视觉问答、图像字幕、简单的数学方程式、OCR 和带描述的零样本图像分类。
观点重申:
Chatgpt不仅仅能提供“文本生成”功能,在进行微调下即可具备灵活的模型自定义功能,能符合不同行业的业务特性。通过模型训练,帮助AI在专业化的行业领域理解特定的语言,以精准满足企业的个性化需求,提升企业效率。
我们认为生成式大模型在图片、视频等内容形态上的突破将各行各业产生更加深刻的影响,微软MLLM模型的发布以及OPENAI预计今年发布的GPT4.0有望加速多模态领域加速,孵化更大的产业机会!投资机会上,看好多模态大模型发展为营销行业带来新的行业红利(内容即流量)和降本增效空间。
标的上,建议关注受益于多模态大模型发展的相关上游企业:当虹科技、网达软件、海康威视、大华股份;营销标的:蓝色光标、利欧股份。此外,与ChatGPT有合作或直接相关的企业、基于大模型开发的AIGC应用场景、具有相关大模型或算法能力等相关标的我们亦持续看好。
风险提示:ChatGPT技术发展不完善、应用不及预期;AI基础设施不及预期;AI伦理风险等
联系人:张良卫/周良玖/郭若娜