09
2023
04

【兴证通信|王楠/章林团队】AI投资前瞻思考


【兴证通信|王楠/章林团队】AI投资前瞻思考


(二):盘古大模型将重点做好行业应用,再次印证前期观点,重视“数据要素+国资云”--20230408 ✿事件:4月8日,人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇表示,未来AI for Industries将是人工智能新的爆发点。 


点评:继百度文心后、华为盘古大模型发力2B市场,再次印证我们的前期观点:#国内大模型率先落地于付费能力更强的2B垂直行业市场。华为云人工智能领域首席科学家田奇表示,未来AI for Industries将是人工智能新的爆发点。华为从2019年立项研发盘古大模型,于2021年4月发布NLP大模型、CV大模型和科学计算三个基础大模型,之后陆续发布行业大模型系列。华为云盘古大模型将推动人工智能开发从“作坊式”到“工业化”升级,未来将重点做好行业应用,为煤矿、水泥、电力、金融、农业、国家云创造产业价值。


 2B端行业大模型或率先商业化落地,#重点行业数据要素价值凸显。受制于初期算力资源、商业模式等原因,国内市场针对2B垂直领域、基于大模型精调之后的小模型有望率先商业化落地。百度、华为、阿里、彭博等已陆续发布多个垂直行业大模型。百度文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、制造等领域。百度最新企业级大模型平台“文心千帆”,使用场景也主要包括政务、金融、企业办公、电商、旅游服务等付费能力较强的2B场景。阿里通义模型也将深入电商、医疗娱乐、设计、金融等行业。


华为盘古AI for Industries,也将主要面向政企、金融、能源等华为传统擅长的政企市场开放。#我们判断未来国内各个大厂腾讯、京东、字节都会推自己的大模型,#微软、谷歌以及未来国内大厂的模型相当于一个通用模型,#大而不精。 

想要给具体行业赋能, 成为某一个领域的专家,#就必须使用对应领域的专业数据来训练”,#只有掌握核心行业数据,#才能训练出适用于行业应用的垂直行业大模型。#未来重点行业数据要素价值凸显。 AI的根基是训练,训练的基础除了算力和算法, 更需要海量的优质数据。 只有掌握核心行业数据,#才能训练出适用于行业应用的垂直行业大模型。


针对金融领域,彭博已构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型BloombergGPT;该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有通用大模型。 要训练专业的行业大模型,优质的行业数据、公共数据至关重要,下一步关注“国资云+数据要素”。AI三大核心要素:算力、算法和数据,数据是AI算法(模型)的“饲料”,重要性甚至超过算法和算力。就国内数据市场而言,据发改委官方批露:我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%,个人和企业可以利用的规模更是不及美国的7%。


因此,加强公共数据的开放开发,是当前急需落实的核心问题。而国家数据局的组建有望,或将从数据源头加快重要政务部门、重点关键行业的数据分类、确权进程。未来,#谁掌握关键核心领域政务、企业数据的治理、运营权,#谁就享有在AI、数字经济时代的顶级定价权。同时,在数据安全、AI大模型自主可控需求背景下,未来国内重点行业、关键领域的核心政务、企业数据进行AI赋能,将大概率运行于各自的私有云(国资云)上,国资云价值有望迎来重估。


 未来国内算法、算力和数据三大要素企业的合作模式,可以参考目前Open AI与微软合作模式,Open AI提供算法、模型,微软提供云算力及数据支持。我们认为未来国内市场不排除出现类似模式,针对前期付费能力较强的2B垂直市场,#国内互联网厂商专注于大模型开发【算法】,#中国电子云、三大运营商等国资云算力国家队提供底层【算力】支持,#CEC等数据要素运营商提供高质量政务、企业【数据语料】。 投资建议:当前市场对算力、算法挖掘较深,数据价值还未充分认知,AI投资下一步更要重视“数据要素+国资云”。


重点推荐:?深桑达A(全栈式自主可控中国电子云、背靠CEC数据要素运营商)、?中国电信、中国移动、中国联通等AI算力国家队、国资云力量,以及第三方云计算基础设施厂商(润泽科技等、关注光环新网、奥飞数据等)。

上一篇 » 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。