solidot新版网站常见问题,请点击这里查看。

OpenAI 开源多语言语音识别系统 Whisper

开源 人工智能
WinterIsComing (31822)发表于 2022年09月26日 16时28分 星期一

来自太阳王与海妖
OpenAI 开源了它的多语言语音识别系统 Whisper,源代码采用 MIT 许可证托管在 GitHub 上。语音识别系统是科技巨头软件和服务的核心部分,Whispe 能将多种语言的语音翻译到文本,并将其翻译到英语。它使用了 68 万小时的多语言语音数据进行训练,数据集是从网络中收集到的,改进了对独特口语、背景噪音和技术术语的识别。