solidot新版网站常见问题,请点击这里查看。
消息
本文已被查看 5847 次
OpenAI 开源多语言语音识别系统 Whisper
OpenAI 开源了它的多语言语音识别系统 Whisper,源代码采用 MIT 许可证托管在 GitHub 上。语音识别系统是科技巨头软件和服务的核心部分,Whispe 能将多种语言的语音翻译到文本,并将其翻译到英语。它使用了 68 万小时的多语言语音数据进行训练,数据集是从网络中收集到的,改进了对独特口语、背景噪音和技术术语的识别。