【财通计算机】商汤发布“日日新”大模型体系,国产大模型再超预期
#商汤发布“日日新”大模型体系。商汤于4月10日在其技术交流日发布了最新的大模型体系日日新,包括了自然语言生成、文生图、感知模型标注、以及模型研发等功能。算力方面,商汤AI大装置目前拥有2.7w片专用GPU芯片,可支持稠密5000亿参数大模型的训练,可以支持20个千亿参数超大模型同时训练。
#发布中文语言大模型“商量”。语言大模型SenseChat“商量”包含了1800亿参数,支持超长文本知识理解、互动式多轮对话、知识自动及时更新。发布会现场演示了几项代表性功能,包括:PDF文件阅读助手,能快速进行法律专业领域的文本分析;编程助手,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%;AI医疗问诊,能通过简单的交互问答快速引导患者的就医流程。
#多模态生成式应用迭代行业场景。商汤在生成式AI应用积累丰富,目前拥有秒画(文生图)、如影(数字人)、琼宇(3D场景生成)、格物(3D物品生成)。其中“秒画”为超10亿参数自研文生图生成模型,和Midjourney类似可通过prompt生成各式画风的图片。据介绍上述生成式AI应用可相互叠加应用,我们认为多模态生成式模型有望加速渗透直播电商、影视创作、广告设计等诸多领域,实现生产力的再次革命。
#国内大模型再次迎来了超预期突破。大模型作为本轮AIGC科技浪潮的核心基座,海外公司引领技术前沿,国内公司勇立潮头奋力追赶。在这一过程中我们认为1)算力是AI模型的能源,将最直接受益于人工智能的普及、2)开发海外应用和国内基础层的公司将在中短期受益于行业“从1到10”的快速拓荒阶段、3)拥有底层语言模型及机器学习算法框架开发能力的公司有望作为行业边界的开拓者长期受益于产业趋势的浪潮。建议关注算力、算法、安全、华为产业链、GPT产业链等相关公司。