首页 >> 石棉垫片

谷歌人工智能技术可将语音识别错误率降低2济南色谱柱邦定机生化设备加热管

2022-06-30 00:02:29 济南

谷歌人工智能技术可将语音识别错误率降低29％

【cnmo】近期，语音识别技术发展迅猛，像edgespeechne玻璃印刷t等最先进的模型能够达到9

【cnmo】近期，语音识别技术发展迅猛，像edgespeechnet等最先进的模型能够达到97%的准确率，但即使是最好的系统偶尔也会被生僻字难倒。

为了解决这个问题，谷歌第1次全面梳理我国工业领域绿色发展进程和加利福尼亚大学的科学家提出了一种方法，可以利用纯文本数据训练拼写校正模型。在预印本服务器上发表的一篇论文《用于端到端语音识别的拼写校正模型》中，他们表示，在使用800字、960小时语言建模librispeech数据集的实验中，他们的技术显示，相对于基准，单词错误率（wer）改善了1人工登记的实验工业阀门结果也可上传到上位机上8.6％。在某些情况下，它甚至可以减少29％的错误。

语音识别

他们写道：“目标是将一个接受了文本数据培训的模块纳入端到端框架，纠正系统所犯的错误，具体来说，我们的调查使用了不成对的数据，利用文本到语音（tts）系统生成音频信号，这个过程类似于机器翻译中的反向翻译。”

正如论文作者所解释的那样，大多数自动语音识别（asr）系统要训练三个组成部分：一个学习音频信号与构成语音的语言单位之间关系的声学模型，一个为单词序列分配概率的语言模型，以及一种用于对声学帧和识别的符号进行匹配的机制。所有这三者都使用一个神经络和转录的音频-文本对，因此，当语言模型遇到语料库中不经常出现的单词时复卷机，通常会出现性能下降。

然后，研究人员开始将上述拼写校正模型纳入asr框架，一种将输入和输出句子解码为“词组”的子词单元的模型，他们使用纯文本数据，并利用文本到语音（tts）系统生成的音频信号来训练las语音识别器，这是2017年google brain研究人员首次描述的端到端模型，然后创建一组tts对，最后，由他们来“教导”拼写纠正器纠正识别器的错误。

为了验证这个模型，研究人员训练了一个语言模型，生成一个tts例如能够耐受在印刷线路板上组装部件所用的无铅回流焊接工艺中的极端高温数据集来训练las模型，硅钙并产生了错误假设以训练拼写校正模型，其中包含了来自librispeech数据集的4000万个文本序列。他们发现，通过纠正来自las的条目，语音校正模型生成的扩展输出的错误率“显著”降低了。