智东西4月18日消息,据外媒The Information报道,微软公司正在研发代号为“Athena”(雅典娜)的AI芯片,为ChatGPT等AI聊天机器人提供技术支持。
消息人士称,微软自2019年以来一直在推进Athena芯片研发项目,项目由微软CEO萨蒂亚·纳德拉(Satya Nadella)牵头,专为大语言模型的训练和推理而设计。Athena目前正由一小群微软和OpenAI员工进行测试,初代芯片可能基于台积电5nm工艺。
尚不清楚该芯片是能够部分替代英伟达(NVIDIA)A100、H100等GPU的通用AI加速器,还是用以辅助提升GPU性能的AI芯片,有业内分析师推测可能是前者。
研究公司SemiAnalysis分析师称,微软每年在Athena研发投入可能在1亿美元左右,如果顺利,微软将通过Athena将每颗芯片成本降低三分之一,从而为ChatGPT发展提供重要动力。
ChatGPT掀起AI新竞赛愈演愈烈,包括亚马逊、谷歌在内的其他大型科技公司都布局了AI芯片,现在,微软也正试图将算力这张“底牌”完全握在自己手里。
消息人士称,Athena是为支持大型语言模型(LLM)训练和推理而专门设计的。比如支持像ChatGPT这样的生成式AI来处理大量数据,识别输入内容并创建新的输出来模拟人类对话。Athena可能计划选择台积电代工,最初的芯片预计将基于5nm工艺。
研究公司Forrester Research的高级云分析师特雷西•吴(Tracy Woo)称,AI的繁荣正给云服务商带来越来越大的压力,迫使他们开发自己的芯片。“你可以从英伟达那里购买,但谷歌和亚马逊等巨头有足够的资金来研发自己的芯片。”
两位知情人士说,OpenAI的ChatGPT聊天机器人发布后引发的兴奋,促使微软加快了Athena研发的推出。分析师估计,在推出两个月后,截至今年1月,该机器人的用户已超过1亿人。
这两位知情人士说,微软最早可能在明年让Athena在微软和OpenAI内部广泛使用。
然而,据其中一位知情人士透露,微软仍在讨论是否将这些芯片提供给其Azure云计算服务的客户。他们说,这是因为大多数客户不需要训练自己的模型,用不到这类芯片。
如果微软决定向其云客户开放Athena,它还必须为Athena开发比英伟达现有产品更有吸引力的软件。英伟达已经用了15年的时间改进了目前的产品,开发人员也在广泛使用它。
研究公司SemiAnalysis首席分析师迪伦•帕特尔(Dylan Patel)称,ChatGPT每天的运营成本约为70万美元,即每条查询0.36美分。他说:“大部分成本是基于他们所需的昂贵服务器。”“与英伟达的产品相比,Athena如果具有竞争力,每个芯片的成本可以降低三分之一。”
AI训练芯片“一哥”英伟达被视作云计算资本支出重心转向AI的最大受益者。据美国《财富》杂志披露,OpenAI一年的计算和数据支出高达4.1645亿美元。分析师称ChatGPT Beta版本使用了10000个英伟达GPU训练模型,新一代GPT-5大模型正在25000个英伟达GPU上训练。
帕特尔说,微软希望在包括Bing、Office 365(现在的Microsoft 365)和GitHub在内的所有应用程序中使用大语言模型。使用市面上已有芯片进行大规模部署,每年将花费数百亿美元。
据一位知情人士透露,微软Athena项目的牵头者是微软CEO萨蒂亚·纳德拉(Satya Nadella),他早在2019年就意识到公司在AI芯片领域落后于谷歌和亚马逊。
虽然微软已为其云计算业务开发服务器芯片,但此前从未有过Athena AI芯片项目的相关报道。一位知情人士说,微软至少有300人在开发Athena。SemiAnalysis公司的帕特尔表示,开发类似于Athena的内部芯片的成本可能在每年1亿美元左右。
微软在2019年宣布将向OpenAI投资10亿美元,该交易规定这家初创公司只使用Azure云服务器,这意味着微软实际上是在补贴OpenAI昂贵的计算需求。
大约在同一时间,微软的领导者开始预测需要多少GPU来支持其所有的AI工作。他们认为,完全依赖英伟达芯片的成本将高得令人望而却步。一位直接了解这一项目的人士说,这些计算考虑了微软内部团队的需求,比如Microsoft 365和Bing,以及微软与OpenAI的关系。
OpenAI已经可以使用微软为这家初创公司打造的超级计算系统,这些系统依赖于英伟达的芯片。去年11月,微软和英伟达宣布了一项为期多年的合作计划,共同打造下一代超级计算机。
微软对Athena的开发可能是双方关系中的一个敏感话题。但据一位直接了解该项目的人士透露,微软并不认为自己的AI芯片可以全面取代英伟达的产品。微软内部的努力如果成功,也有可能帮它在未来与英伟达交易中占据更多主动。
随着ChatGPT引发全球AI大模型竞赛,几乎全球云大厂都行动了。竞赛背后海量的算力需求爆发和成本压力不容忽视,这也成为云大厂抢滩大战中关注的一大焦点。
本次,微软突然被曝出AI芯片Athena已研发三年,既在意料之外,又在情理之中。当下通用人工智能发展尚属于早期,ChatGPT建立的算法和数据优势若要持续,微软必须在底层算力层面建立更强悍的优势。
GPT算力军备赛打响,各个云大厂都在加大芯片布局,比如亚马逊旗下AWS近期就推出了由自研芯片Trainium、Inferentia2提供支持的计算云产品。这也将使得在AI芯片市场独大的英伟达面临压力,其与云大厂的关系中的竞争成分也正在加强。