AI智能语音识别算法下篇（人工智能语音识别算法）-人工智能-知优网

一、神经网络

当前常用的语音识别框架如下图

其背后的逻辑是

在特征提取时采用的神经网络里面的DNN技术

DNN技术可以分为两种，一种是CNN模型，一种是RNN模型

二、解码器

解码器信息来源于声学模型、词典、语言模型。框图如下：

2.1 声学模型

常用的声学模型为GMM-HMM，即混合高斯模型-隐马尔科夫模型

HMM模型对时序信息进行建模，在给定HMM的一个状态后，GMM对属于该状态的语音特征向量的概率分布进行建模。

2.2 词典

字典：就是发音字典，中文中就是拼音与汉字的对应，英文中就是音标与单词的对应

用途：

根据声学模型识别出来的音素，在字典中来找到对应的汉字（词）或者单词，用来在声学模型和语言模型建立桥梁，将两者联系起来。

比方如下词语的映射表：

2.3 语言模型

语言模型是针对某种语言建立的概率模型，是用来计算一个句子的概率的概率模型。

划分以下两种：

2.3.1 N元统计语言模型：N-gram模型、平滑化

2.3.2 神经网络语言模型：

与统计语言模型不同的是，神经网络语言模型不通过计数的方法对nn元条件概率进行估计，而是直接通过一个神经网络对其建模求解。

用途：

1、决定哪一个词序列的可能性更大

2、已知若干个词，预测下一个词

例子：

1、I went to a party.

Eye went two a bar tea.

2、你现在在干什么？

人工智能语音识别

转载请说明出处
知优网 » AI智能语音识别算法下篇（人工智能语音识别算法）

站长资讯网友投稿帖

分享到：

相关推荐

通用人工智能突破：一个模型、一套权重通吃600+视觉文本和决策任务

趣AI |“咬牙认证”来了，安全性“吊打”指纹识别？

百度：截至4月全球人工智能专利申请超过2.2万件（百度人工智能专利数量）

贾跃亭被纪律处分！法拉第未来内部调查公布（贾跃亭持有多少法拉第未来）

年报深解：英伟达或将由盛转衰？（英伟达年报）

美国防部新项目曝光：AI决定军事行动？（美国国防部人工智能战略）

物联网如何改变航空业？（物联网如何改变航空业的发展）

通过人工智能实现物联网革命：为什么它们完美地结合在一起（物联网和人工智能结合）

物联网和人工智能：强大组合的5个有趣应用（物联网和人工智能:强大组合的5个有趣应用是什么）

分析和人工智能正在推动物联网的发展（随着人工智能、物联网技术的不断发展）

发表评论