内容正文:
信息科技 课件
2022新版课标内容
《第5课 语音识别技术》
2023年浙教版 八年级下册
学习目标
1、通过人机对比,了解机器语音识别的基本原理
2、知道语音识别技术对社会产生的巨大影响
今天在我们的教室里来了一位新同学,猜猜他是谁。
问题情境
他就是豆包同学,快和他交流一下吧!
好的,接下来我们来进行课堂导入。我们知道在互联网中连接的相当多的计算机,这些计算机遍布世界各地。比如我们,其实无论相隔多远,我们要联系我们的朋友,或者家长,只需要打一个微信电话就可以联系上对方。那么,接下来我们来看一下,我们古代中国人是如何把信息传递让远方的。
3
想一想
一:为什么豆包同学能够听懂我们说话呀?
二:这其中用到了人工智能的什么技术?
三:它是怎么工作的?
我们学过一篇课文叫做烽火戏诸侯,请各位同学回忆一下,在他们的那个时候,他们是使用什么工具来传递信息的呢?。
为了他的老婆燃边疆告警的烽火台,那个烟就烧起来了,别人看见了,以为敌人来犯,就过来救他。然后发现,这个周幽王在忽悠他们,于是心生怨恨,下次叫他他就不来了。最终周幽王因此而死。同学们已经看完了这个故事,现在请一位同学来回答一下,他们使用什么工具来传递信息?检验各位同学的时候来了,同学们有没有想过这样一个问题都是同样来到这里上课,上的的都是相同的内容,唯一不同的只是各位自身不同而已,有一个表现就是思想活动的不同。所以我们会有这样的疑问,为什么别人能够考得很好?所以说思考很重要,该思考的时候一定要思考,不然再坚硬的铁也会生锈。
4
一、语音识别
语音识别技术(Automatic Speech Recognition)就是让设备能听懂人类语音的一项技术。
“声 控”
语音识别(ASR)
语音————————“指令”或者“文本”
模拟探究:语音识别是怎么实现的?
二、语音识别过程
先要了解:人是如何听到声音转化为文字的?
人类
听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容
① ② ③ ④ ⑤
听懂
理解
回答
二、语音识别过程
机器如何听到声音转化为文字的?
听到声音——仔细辨别、消除杂音——比对、识别音素——依靠经验和前后语义——确定内容
① ② ③ ④ ⑤
收集声音
显示结果
处理声音
豆包机器
谐音字哪:抱负?包袱?报复?
二、语音识别过程
听到声音
第一步
计算机用什么“听到”声音?
“听到”声音就是从模拟信号转变为数字信号的过程
观看以下视频的部分内容《https://www.bilibili.com/video/BV1Sb4y1H7eW/?spm_id_from=333.337.search-card.all.click&vd_source=a3b085c6762de3a15bd46347b13fb3d4》
二、语音识别过程
声音数字化
采样、量化、编码。声音从模拟信号转变为数字信号。
声音数字化之后,常常在电脑上以波形文件的形式呈现,如下图,我们用了大家最熟悉的scratch,录制了“喵”这个声音,得到以下波形
实验3:
“猫”和“高”的波形文件相同吗?
同一个人的说不同字波形文件相同吗?
不同的人说同一个字波形文件是否相同?
二、语音识别过程
仔细听、辨别噪音
第二步
2.消除杂音
人即使在嘈杂的环境中也能努力甄别有效声音,或者通过调整距离来听清,那在语音识别环节我们怎么做?
1.精准拾音
近场识别技术:可拾音距离<1m,正常拾音距离范围≤10cm
远场识别技术:主要解决回声干扰、室内混响、多信号源干扰,从而实现较远距离的拾音等
手机和天猫精灵分别会采用什么技术?
二、语音识别过程
特征提取、模式匹配
第三 比对、识别声音
おはよう,ou h ayo
我和谁最像??
声学模型
实际过程中,我们会切成更小的声音片段——音素,然后进行比对音素是最小的语音单位。查阅p27页国家的音素。
大数据在这个过程中发挥什么作用?
二、语音识别过程
依靠经验 确定内容
第四步
抱负?包袱?报复?
你的理想baofu是什么……
声学模型识别出单个音素,而语言模型可以让我们找出该音素出现频率最高的一个词语,同时,使得单词和单词之间的搭配符合语言习惯。
你好的波形
n i h ao
尼好
尼号
你好
你号
去噪音
二、语音识别的过程
问:如果要让人工智能听懂家乡的方言,你觉得哪个环节要改一下?
总结:影响声音识别的因素有哪些?
实践:语音识别
有哪些语音识别应用?
1.siri 智能家居 唤醒万物
2.会场翻译、翻译笔、微信等 语音转文字
3.提取视频台词
4.记录
实践:语音识别
小飞预设的指令:向左转 向右转 笑一个 点头
用机器人“小飞”
体验语音识别
INTERNET OF THINGS
谢谢聆听!
$$