七乐彩最近500期走势图 百度官网

  • 时间:
  • 浏览:55
  • 来源:上游棋牌

【cnmo新闻】近期,语音识别技术发展迅猛,像edgespeechnet等最先进的模型能够达到9

【cnmo新闻】近期,语音识别技术发展迅猛,像edgespeechnet等最先进的模型能够达到97%的准确率,但即使是最好的系统偶尔也会被生僻字难倒。

为了解决这个问题,谷歌和加利福尼亚大学的科学家提出了一种方法,可以利用纯文本数据训练拼写校正模型。在预印本服务器arxiv.org上发表的一篇论文《用于端到端语音识别的拼写校正模型》中,他们表示,在使用800字、960小时语言建模librispeech数据集的实验中,他们的技术显示,相对于基准,单词错误率(wer)改善了18.6%。在某些情况下,它甚至可以减少29%的错误。

语音识别

他们写道:“目标是将一个接受了文本数据培训的模块纳入端到端框架,纠正系统所犯的错误,具体来说,我们的调查使用了不成对的数据,利用文本到语音(tts)系统生成音频信号,这个过程类似于机器翻译中的反向翻译。”

正如论文作者所解释的那样,大多数自动语音识别(asr)系统要训练三个组成部分:一个学习音频信号与构成语音的语言单位之间关系的声学模型,一个为单词序列分配概率的语言模型,以及一种用于对声学帧和识别的符号进行匹配的机制。所有这三者都使用一个神经网络和转录的音频-文本对,因此,当语言模型遇到语料库中不经常出现的单词时,通常会出现性能下降。

然后,研究人员开始将上述拼写校正模型纳入asr框架,一种将输入和输出句子解码为“词组”的子词单元的模型,他们使用纯文本数据,并利用文本到语音(tts)系统生成的音频信号来训练las语音识别器,这是2017年google brain研究人员首次描述的端到端模型,然后创建一组tts对,最后,由他们来“教导”拼写纠正器纠正识别器的错误。

为了验证这个模型,研究人员训练了一个语言模型,生成一个tts数据集来训练las模型,并产生了错误假设以训练拼写校正模型,其中包含了来自librispeech数据集的4000万个文本序列。他们发现,通过纠正来自las的条目,语音校正模型生成的扩展输出的错误率“显著”降低了。

猜你喜欢

排三1000期走势图官网

 01、中国五金制品协会厨房设备分会成立4月12日,由民政部批准的中国五金制品协会厨房设备分会于厦门成立,这意味着厨房设备行业有了权威的组织机构,对未来行业制定标准、

2019-09-30

福彩3d三天计划两胆码平台

城市在转型,产业在升级,作为传统的重工业城市,黄石向着鄂东特大城市的目标稳步迈进。五金机电产业作为现代化建设机器的动力之源,填补黄石城市专业五金市场空白。  

2019-09-30

大乐透基本走势图表图新浪爱彩官网

我国家具五金生产企业普遍呈现出品牌杂、档次低端、质量没有保障、技术花哨不实用、企业规模小、产业不规范等众多问题。而且有相当一小部分地方家具五金企业依然以作坊生产、家族化运营形式

2019-09-30

爱彩人彩票网走势图平台

】如今,传统水产业走到了转型的十字路口,深挖“水面之下”的潜能,坚持生态优先,坚持绿色兴渔,科技兴渔,走高质量发展、可持续发展之路,各地水产养殖产业踏上

2019-09-24

中国体彩7星彩走势图平台

国际文传电讯社3月26日,江布尔州州政府称,2014年该州农作物种植面积54.49万公顷,比2013年增加2100公顷。其中谷物种植面积11.53万公顷,甜菜7500公顷,油料

2019-09-24