SAM Audio - Meta推出的开源多模态音频分割模型

作者:Jam 发布时间: December 18, 2025 分类:技术 No Comments

SAM Audio是Meta推出的开源多模态音频分割模型，从复杂的音频混合中精准分离出任意目标声音。通过结合文本、视觉和时间维度的提示，实现灵活、高效的音频处理，为音频编辑、去噪、声音提取等任务提供了全新解决方案。用户可以通过简单的文本描述（如“吉他声”）、在视频中点击发声物体，或者标记声音出现的时间范围来使用SAM Audio。 SAM Audio - Meta推出的开源多模态音频分割模型

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

SAM Audio - Meta推出的开源多模态音频分割模型