MMS是一个多媒体信息服务,近日Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。
Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。
Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。