国盛通信宋嘉吉【Dolly2.0,大模型的开源时代】
?开源社区的发展一日千里,“每个中大型公司都有一个GPT模型”的未来正在加速到来。
?上周,大语言模型Dolly2.0发布,并宣布将开源代码、模型和数据集。其中的指令数据集正是ChatGPT性能较GPT-3提升的关键之一。
?并且,Dolly2.0打造的1.5万条指令数据集,完全由该团队5000名员工撰写,并非来自OpenAI,一举终结此前Alpaca、GPT4All、Vicuna等开源大模型无法商用的尴尬局面。
?当模型和数据不再是掣肘,在大模型开发加速、应用爆发、“蛋糕”越做越大的当下,我们坚定看好算力+应用的正循环。