NG体育ICLR 2023杰出论文奖得主独家分享:适配任意密集预测任务的通用小样本学习器
微软研究员联合Yoshua Bengio推出AIGC数据生成学习范式Regeneration Learning
胡瀚:成功用Swin Transformer连接CV和NLP主流架构的“破壁人”
最近,大型语言模型展现出的强大能力引发了新一轮的 AIGC (人工智能生成内容)研究和应用热潮。人工智能的创作能力边界已经从文字问答、编程逐渐扩展到了绘画、音频等多模态领域。但在视频领域,尤其是超长视频内容的生成上,目前大多数模型的效果还不尽如人意。近期,微软亚洲研究院 NUWA 多模态生成模型家族迎来了新成员——NUWA-XL,其以创新的 Diffusion over Diffusion 架构,首次实现了高质量超长视频的并行生成,为多模态大模型提供了新的解题思路。
近日NG体育,由微软亚洲研究院提出的 Roll-out Diffusion Network (RODIN) 模型,首次实现了利用生成扩散模型在 3D 训练数据上自动生成 3D 数字化身(Avatar)的功能。仅需一张图片甚至一句文字描述,RODIN 扩散模型就能秒级生成 3D 化身,让低成本定制 3D 头像成为可能,为 3D 内容创作领域打开了更多想象空间。相关论文“RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion”已被 CVPR 2023 接收。
那些在聊天框里输入又删掉的话,那些在微博小号里才能记载的心情,那些在朋友圈仅自己可见的动态,那些在计算机领域科研、学习、生活中遇到的难题,一直在线的树洞接收到了你们的信号。在将树洞收到的内容筛选、归类后,我们为提问的你匹配到了微软亚洲研究院中合适的解答者。听一听树洞连接到的第一波回复,希望这些真诚的回应能够成为大家科研生活中情绪负担的舒缓解药。
Researcher(All Level) - AI for Science (Job ID: 1472092)