本文共 364 字,大约阅读时间需要 1 分钟。
Mozilla发起了"Common Voice"开源语音识别项目,旨在打破大公司对语音识别技术的垄断。当前的大多数语音识别技术都集中在少数大公司手中,这不仅导致开发成本高昂,还限制了技术的自由使用。
在"Common Voice"项目中,参与者可以访问一个大型数据库,用于训练开源语音识别引擎。开发者可以通过这些数据轻松构建语音应用程序,涵盖实时语音翻译、智能音频助手等多种场景。用户还可以参与语音文本的审核,帮助改进识别模型。
Mozilla计划从2017年6月起收集超过10000小时的语音数据,并最终开源该语音数据库。目前的数据来源包括用户捐献和一些公开电影剧本,如《圣诞奇遇》。为了提高识别准确性,Mozilla特别注重收集多样化语音,涵盖不同场景下的背景噪音和对话声。
该项目已在GitHub上线,欢迎开发者参与贡献。
转载地址:http://vvffk.baihongyu.com/