14
2023
04

【微软DeepSpeed Chat开源简评】国金计算机


【微软DeepSpeed Chat开源简评】国金计算机

事件:微软开源了可以在模型训练中加入完整RLHF流程的系统框架——DeepSpeed Chat,加速了“定制版”生成式大模型的落地。

点评:


1、【垂类模型及应用落地加速,数据壁垒凸显】

llama等优质开源模型的发布促进了垂类模型的发展,DeepSpeed锦上添花,加速了强化学习的过程、提升了AI应用开发者的效率。拥有优质垂类数据的公司可能会训练出应用效果更好的模型。

2、【算力方面:训练及推理需求均随落地场景丰富而打开】

总需求=场景数*单场景算力需求。训练算力最大的消耗主要在预训练阶段,开源模型的发布主要是节省了训练阶段的算力;但由于垂类训练场景更加丰富,我们认为总的训练需求是增长的,并没有被通用大模型所集约化。

推理端,随着场景的丰富,预计推理芯片需求空间会被持续打开。

3、【综上,我们看好拥有垂直领域数据、以及算力相关公司】具体推荐关注:

☀金融科技:同花顺、财富趋势、恒生电子、顶点软件、凌志软件;

☀医疗/医保IT:久远银海、山大地纬、卫宁健康、创业慧康;

☀教育IT:视源股份、鸿合科技、国新文化;

☀交通IT:千方科技、四维图新、通行宝;

☀安防/数智化转型:海康威视、大华股份、千方科技、苏州科达;

☀决策分析服务:零点有数、慧辰股份;

☀电力IT:远光软件、朗新科技、国网信通、智洋创新、国能日新、恒华科技;

☀矿山IT:龙软科技、北路智控、云鼎科技、梅安森;

☀工业软件:中控技术、中望软件、赛意信息、能科科技、汉得信息、霍莱沃、盈建科、鼎捷软件;

☀办公软件:金山办公。

☀边缘计算:中科创达、云天励飞。

☀算力相关:寒武纪、海光信息、景嘉微等。

国金计算机:孟灿/李忠宇/王倩雯/陈矣骄/纪超/赵彤

上一篇 » 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。