× 快速导航
新闻资讯
分类
计算机行业点评报告:微软开源DEEP SPEED CHAT 坚定看好算力设施
发布日期:2023-04-16 11:47:44

  计算机行业点评报告:微软开源DEEP SPEED CHAT 坚定看好算力设施

  2023 年4 月12 日,微软宣布开源了Deep Speed Chat,帮助用户轻松训练类ChatGPT 等大语言模型,使得人人都能拥有自己的ChatGPT。

  微软开源Deep Speed Chat,人人拥有ChatGPT 时代已来临: ChatGPT 模型的训练是基于InstructGPT 论文中的RLHF 方式,这使得现有深度学习系统在训练类ChatGPT 模型时存在种种局限。现在,通过Deep Speed Chat 可以突破这些训练瓶颈,达到最佳效果。Deep Speed Chat 拥有强化推理、RLHF 模块、RLHF 系统三大核心功能。强化推理方面,可实现简化 ChatGPT 类型模型的训练和强化推理;Deep Speed-RLHF 模块方面,复刻了InstructGPT 论文中的训练模式,并确保包括监督微调(SFT)、奖励模型微调和基于人类反馈的强化学习在内的三个步骤。DeepSpeed-HE 能够在RLHF 中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化。此外,Deep Speed Chat 在成本、效率、扩展性等方面非常优秀,效率方面,此模型高效且节省成本,只在Azure 云上只需9 小时即可训练一个OPT-13B 模型,只需18 小时即可训练一个 OPT-30B 模型。这两种训练分别花费不到300 美元和600 美元。

  Deep Speed Chat 高效赋能AI 行业,显著提升效率并降低成本,我们认为AIGC 百花齐放的时代已经到来。

  我们认为微软此次开源Deep Speed Chat 就像当年的互联网,为了提升发展速率降低了台式机的价格,使得普通用户也能拥有自己的电脑。效率方面,根据华尔街见闻消息,可将训练速度提升15 倍以上,成本却大幅度降低。例如,一个130 亿参数的类ChatGPT 模型,只需1.25 小时就能完成训练。我们认为通过Deep Speed Chat解决资源、算法等难题,轻松、高效的训练数千亿参数的最先进的类ChatGPT 模型。我们认为AIGC 百花齐放的时代已经到来,原因是Deep Speed Chat 显著降低训练门槛,中小厂商有望以更低的成本加速实现类ChatGPT的开发,并显著降低成本,AIGC 百花齐放的时代正式来临,我们认为金融、办公、医疗、智能助理、XR、智能助手、智慧音响等领域有望率先赋能。

  再此重申强调ChatGPT 的竞争本质即大模型储备竞赛,算力是打造大模型生态的必备基础,算力在大模型的背景下势必迎来大爆发。算力是训练大模型的底层动力源泉,一个优秀的算力底座在大模型(AI 算法)的训练和推理具备效率优势,其中包括AI 服务器、AI 芯片等为核心产品。大模型参数呈现指数规模,引爆海量算力需求。根据财联社和OpenAI 数据,ChatGPT 浪潮下算力缺口巨大,根据OpenAI 数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。运算规模的增长,带动了对AI 训练芯片单点算力提升的需求,并对数据传输速度提出了更高的要求。根据智东西数据,过去五年,大模型发展呈现指数级别,部分大模型已达万亿级别,因此对算力需求也随之攀升。

  我们认为ChatGPT 等大模型的出现,势必引爆算力需求。受益标的为: 首都在线、寒武纪、海光信息、浪潮信息、中科曙光、景嘉微、龙芯中科、神州数码、拓维信息、广电运通、云赛智联、青云科技、优刻得、光环新网、新炬网络、工业富联等。

  政策推进不及预期的风险、宏观经济下滑风险、核心技术研发不及预期的风险、中美贸易摩擦升级的风险。