英伟达Fugatto：AI音频制作的全新工具-百合树AI写作-专业学术论文写作助手

收录于话题

英伟达（NVIDIA）近期展示了一款名为Fugatto的人工智能模型，该模型在音频生成和修改领域展现出了革命性的潜力。Fugatto，全称为Foundational Generative Audio Transformer Opus 1，是一款能够根据文本提示生成和修改音乐及音频的AI工具。

Fugatto基于生成式Transformer架构，拥有25亿参数，并在NVIDIA DGX系统上使用32个NVIDIA H100 Tensor Core GPU进行训练。该模型由来自世界各地的多元化团队开发，包括印度、巴西、中国、约旦和韩国，这使得Fugatto具备更强的多口音和多语言能力。

尽管Fugatto尚未公开发布，但英伟达表示目前仍在讨论是否以及如何将其公开发布。生成式AI模型的创造者尚未确定如何防止滥用该技术，例如用户生成错误信息或生成受版权保护的角色来侵犯版权。

【结语】英伟达的Fugatto模型为音频领域带来了革命性的变革，它不仅展示了AI在音频生成和处理方面的巨大潜力，也为未来的多媒体内容创作提供了新的可能性。随着技术的不断发展，我们期待Fugatto能够在音频创作和处理方面发挥更大的作用。

??我的其他公众号：

??我的社群：和创作者一起交流心得，分享经验，共同进步。

英伟达Fugatto：AI音频制作的全新工具