【国盛计算机】时代继续前行
最近各种噪音比较多,真正的逻辑判断终将被认知,大家都学的很快,我们这里加速一些。
1、我们买大模型买的是什么?根据拾象(和硅谷VC与产业紧密联系)的报告,大模型在应用端价值量占比约为60%,未来GPT必然牵动万亿以上市场,大模型撬动的空间极大,极小份额依旧是巨量,是投资赔率极高的领域。
2、大模型是否稀缺?现在从事大模型研发的团队逐步增多,但总体真正加速均为去年底开始(GPT2结果晃点了整个产业)。客观说,即使BAH现在模型水平与GPT3- DAVINCI-002仍有不小差距,A股相关大模型也并未与BAH、澜舟、智源、MINIMAX等出现不可逾越的差距。大模型研发不稀缺,A股的大模型稀缺,有效的好的大模型极度稀缺。
3、A股大模型的安全垫在哪儿?GPT通过FINETUNE、PLUGIN、多模态应用形成万物智能。一方面,大模型研发结合多模态、FINETUNE下的行业应用能显著提升应用效果,即使通用性更强的模型替代在局部场景优势也并非特别明显(我们并不需要产业工人去洗衣做饭)。另一方面,大模型研发积累对各行业的FINETUNE提供宝贵的KNOWHOW积累,这在未来的产业发展中即使不是FOUNDATION MODEL巨擘,也可能成为应用大佬。
4、什么样的数据是有用的?
在GPT3-INITIAL的训练中,实际都是互联网上的COMMON CRAWL为主(不需要也不应该用私域数据),在CODEX会有,但非GITHUB的代码也难以获得。INSTRUCT更多的是规则考虑。我们认为数据只有在与应用紧密结合的FINETUNE、行业应用中才会有价值,应用展望闭环下数据才能真正施展价值。时代继续前行,供参考