内容正文:
语音识别(Automatic Speech Recognition)
1
01
通过人机对比,了解机器语音识别的基本原理
02
知道语音识别技术对社会产生的巨大影响
学习目标
2
课堂导入
今天在我们的教室里来了一位新同学,猜猜他是谁。他就是小爱同学和他交流一下吧!
问题情境
好的,接下来我们来进行课堂导入。我们知道在互联网中连接的相当多的计算机,这些计算机遍布世界各地。比如我们,其实无论相隔多远,我们要联系我们的朋友,或者家长,只需要打一个微信电话就可以联系上对方。那么,接下来我们来看一下,我们古代中国人是如何把信息传递让远方的。
3
想一想
一:为什么小爱同学能够听懂我们说话呀?
二:这其中用到了人工智能的什么技术?
三:它是怎么工作的?
我们学过一篇课文叫做烽火戏诸侯,请各位同学回忆一下,在他们的那个时候,他们是使用什么工具来传递信息的呢?。
为了他的老婆燃边疆告警的烽火台,那个烟就烧起来了,别人看见了,以为敌人来犯,就过来救他。然后发现,这个周幽王在忽悠他们,于是心生怨恨,下次叫他他就不来了。最终周幽王因此而死。同学们已经看完了这个故事,现在请一位同学来回答一下,他们使用什么工具来传递信息?检验各位同学的时候来了,同学们有没有想过这样一个问题都是同样来到这里上课,上的的都是相同的内容,唯一不同的只是各位自身不同而已,有一个表现就是思想活动的不同。所以我们会有这样的疑问,为什么别人能够考得很好?所以说思考很重要,该思考的时候一定要思考,不然再坚硬的铁也会生锈。
4
语音识别技术(Automatic Speech Recognition)就是让设备能听懂人类语音的一项技术。
语音识别
听懂
理解
回答
人类
机器
收集声音
显示结果
处理声音
6
外界语音
分帧
特征提取
声学模型
语音模型
发音字典
我们可以总结出以下过程,第一个步骤就是从外界获取收入可以看到,这是一个麦克风生活中的例子,生活中的例子就是各种各位领导在上海讲话的时候,手里都会拿着一个什么话筒对。然后第二个分针就是说把这种声音声音分成一片又一片一片,又一片对它对他进行分析。然后接下来的一个步骤就是特征提取,因为我们说话的每一个声音都有他的一个特征。接下来就是一个升学模型,模型实际上就是一个概率,我们会仔细讲。接下来还要经过一个发音字典,这个字典类似我们查字典的过程。这个语音模型并不像各位学生想得那么高深莫测,它实际上也是一个概率。下面我们会仔细讲。
语音识别的过程:就是找到在声音 x 下出现概率最高的w。
X表示声音的特征,W表示一个词。
语音识别的过程用很标准的来说都是相当的抽象的,就是在找到声音下,出现概率最高的w,X表示声音的特征,W表示一个词.这样说来实在是太抽象了,各位同学可能理解不了.
我们来做一个游戏,我们来做一个听写.第一个理解万岁,第二个英文单词Etta attitude,altitude.。我们可以看到很多同学都写下了理解万岁,那么有没有一种可能,他是李姐万岁呢?
当然有可能,就是说在互联网上兴起的一个这个梗,就叫做理解万岁。虽然说我并不是很情愿说互联网上的梗,但是为了方便你们理解,我不得不说,比如说以前有一个小黑子,坤坤,识别的概率是不会那么高的。
声学模型
表示一个单词发出某段语音信号的概率.
最终得到的并不是文字。
语音模型
统计一个词出现的概率,概率越高,就是我们想要的那个词
语音识别系统
两个共同构成
深度学习下的语音识别
语音(中/英)
神经网络
文本(中/英)
体验语音识别
siri
vivo手机助手
微信语音转文字
识别正确率的影响因素
1.对自然语言的识别与理解。
2.语音信息量太大。
3.语音的模糊性。
4.单个字母或者词、字的语音特性。受上下文的影响,以致改变重音、音调、音量和发音速度等。
5.环境噪声和干扰对语音识别有严重影响,致使识别率低。
走进生活
技术的学习应该应用于生活中。
我们怎么使用语音识别给我们的学习和生活带来帮助呢?
13
走进生活
飞书秒记
课堂总结
1.语音识别过程
2.声学模型
3.语言模型
4.影响声音识别的因素
这节课我们讲了存储转发策略,举了一个例子叫烽火戏诸侯,里面传递信息用的什么呀?烽火对不对?通过一站一站(逐站)的烽火来传递信息,可
15
语音处理系统过程
声音数字化
信号预处理
特征
提取
模式
匹配
声学
模型
音素序列
语言
处理
语言
模型
识别结果
语音输入
结果输出
16
$$