【百度速评】:百度宣布其类ChatGPT项目“文心一言”即将于3月发布
百度为什么能够在ChatGPT推出的很短时间内就能研发出类似的产品?
➡️百度的文心大模型和Open AI的GPT模型类似,在2019年就已经推出,并且已经迭代了多代,从单一的自然语言理解延申到多模态,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。
➡️以最新发布的ERNIE 3.0 Zeus为例,该模型迭代于ERNIE 3.0,拥有千亿级参数。其已经具备智能创作等各类自然语言理解和生成任务,且公开数据集上小样本学习、理解和生成任务效果皆好于业界其他模型。
➡️此次“文心一言”产品并非是百度文心大模型的第一个产品,其AI作画平台“文心一格”和产业级搜索系统“文心百中”已经面相公众开放。
百度大模型的持续发展拥有强大算力支撑?
➡️百度拥有多个云计算可用区、庞大的超算集群,奠定大模型训练的基础设施。目前公司有阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器。我们认为,百度智能云能为ERNIE大模型应用提供高并发、高弹性、高精度等不同计算需求。
➡️百度自研AI芯片“昆仑”已在多场景实际部署几万片,在公司搜索业务中也已形成较强工程化实践。综上,我们认为“文心一言”底层算力有所保证。
现有数据规模能够助力产品实现0-1,马太效应下模型将越来越聪明。
➡️ChatGPT 模型训练使用主要来自互联网的文本数据库,包括从网络文本、维基百科、文章中获得高达 570GB的数据,我们认为百度的搜索业务在真实数据和用户需求理解方面的积累有较强的先发优势,这些大规模结构化非结构化数据有望支撑ERNIE bot的充分预训练。
➡️另外,随着ERNIE Bot的公众开放,有望建立起立真实的用户调用和模型迭代之间的飞轮,模型将越来越聪明。
从商业应用来看,我们认为可以沿着2C和2B两条路径共同发展。
2C来看,文心一言可以植入在百度搜索中,双引擎运作一方面可以弥补搜素效率不高的问题,同时也可以补充文心一言单一答案生成、用户信任度不够的问题。
2B来看,搭载在云计算产品上赋能各行各业创意生成、内容创作等,让AI辅助人工作,可以帮助企业大幅降低成本,我们认为商业前景可期。
基本面:
➡️下行风险低:我们认为百度核心广告业务的合理估值约为340亿美元(2023e PE 10x),截至3Q22公司净现金有140亿美元。
➡️上行空间大:股价弹性来自于云、AIGC和自动驾驶等新业务。➡️我们在可能之处做一些方向性的探讨和对比供大家参考:1)AIGC:如果对标OpenAI的估值290亿美元左右,我们认为百度文心的技术、商业实力不弱于OpenAI,可给予估值弹性;2)云计算;3)自动驾驶。