DeepSpeed Chat具有以下三大核心功能：

1. 简化ChatGPT类型模型的训练和强化推理体验

开发者只需一个脚本，就能实现多个训练步骤，并且在完成后还可以利用推理API进行对话式交互测试。

2. DeepSpeed-RLHF模块

DeepSpeed-RLHF复刻了InstructGPT论文中的训练模式，并提供了数据抽象和混合功能，支持开发者使用多个不同来源的数据源进行训练。

3. DeepSpeed-RLHF系统

团队将DeepSpeed的训练（training engine）和推理能力（inference engine) 整合成了一个统一的混合引擎（DeepSpeed Hybrid Engine or DeepSpeed-HE）中，用于RLHF训练。由于，DeepSpeed-HE能够无缝地在推理和训练模式之间切换，因此可以利用来自DeepSpeed-Inference的各种优化。

DeepSpeed-RLHF系统在大规模训练中具有无与伦比的效率，使复杂的RLHF训练变得快速、经济并且易于大规模推广：

高效且经济：

DeepSpeed-HE比现有系统快15倍以上，使RLHF训练快速且经济实惠。例如，DeepSpeed-HE在Azure云上只需9小时即可训练一个OPT-13B模型，只需18小时即可训练一个OPT-30B模型。

这两种训练分别花费不到300美元和600美元。

作者:乌龟流 | 分类:调研纪要 | 浏览:195 | 评论:0

上一篇 »?【财通宏观陈兴】第三世界的出口，非典型的复苏下一篇 »【天风建材】宁夏建材旗下工业互联网及智能化软件平台中建信息，聚焦建材能源领域AI视觉智能，建议重点关注。

发表评论:

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

乌龟流

低风险投资-FIRE运动

13

2023
04

DeepSpeed Chat具有以下三大核心功能：

发表评论:

两融余额持续新高

看一家破产企业的三张表

2024年9月27日上交所宕机

10点魔咒

白酒渠道商的困境

银行坏账率及其调节手段

3A转债希望转2的近期观点

华尔街的老投资家们

截断亏损，让利润奔跑

这游戏玩来玩去能降维打新来的吗

数字经济的小观点

上市公司价值的多重视角

低风险投资-FIRE运动

13

202304

DeepSpeed Chat具有以下三大核心功能：

发表评论:

2023
04