内容正文:
八年级下 物联网、人工智能
第11课 语音识别技术
术
技
息
信
1
1
玩一玩
约定:一个同学说话的时候,其余同学请保持安静。
小爱同学
请打开一号灯
小爱同学
请关闭一号灯
小爱同学
今天天气怎么样?
想一想
三位同学与小爱同学之间发生了什么?
它是怎么工作的?
这是一种什么技术?
这种技术有什么优势?
人机交互
语音识别技术
界面更加方便,使用更加容易,可以更多人群服务
说一说
请同学们阅读课本和老师提供的资料(桌面上“语音识别相关资料”)
小组派代表说一说,人机交互的过程
以小组为单位(相邻2个同学为一组),议一议刚才人机交互的过程
小学毕业到高中入学
填写报名信息
初中学校审核
参加测试分班入学
参加
中考
初中
学习
中考成绩
高中录取审核
高中分数线
被*高中
录取
小学毕业报名
到高中入学
语音识别的过程
声音数字化
信号预处理
特征
提取
模式
匹配
声学
模型
音素序列
语言
处理
语言
模型
识别结果
语音输入
结果输出
语音识别模型
声学模型:一般用隐马尔科夫模型进行建模(HMM),采集成千上万个人的发音样本,提取每个单词所包含的发音特征,从而形成声学模型。
可以用一个精简的数学公式来表示P(W|X)
X表示声音的特征,W表示某个词,P表示概率
它的功能是统计一个单词发出某段语音信号的概率。
语言模型,对搜集到的海量语句进行分析统计,获得单词与单词之间搭配的概率关系。
也可以用数字公式P(W)表示,它的功能是统计一个词出现的概率,概率最高,也就是我们需要的那个词。
语音识别的实践
硬件介绍:掌控板
语音识别的实践
软件介绍:mPython软件
硬件连接提示
刷入按钮
图形化代码模块
编辑区
代码解读(一)
连接Wi-Fi,需要用到网络服务
网络校时,确保时间准确
设置变量,用于存储录音文件
代码解读(二)
亮红灯 开始录音
录制声音,并提交讯飞平台进行识别处理
屏显识别结果
12
练习单1
练习单1 朗读人________
序号 内容 识别出正确的文字数量 正确率
1 回家吃饭
2 吃饭回家
3 Hello world
4 World hello
练习单2
练习单2 朗读人________
序号 内容 识别出正确的文字数量 正确率
1 最后
2 醉后
3 最后我们胜利了
4 醉后不知天在水
练习单3
练习单3 朗读人_________
序号 内容 采用的语言(普通话填1,方言填2) 识别出正确的文字数量 正确率
1 计算机
2 娃娃
3 计算机要从娃娃抓起
拓展
自创语句
序号 内容 识别出正确的文字数量 正确率
1
2
3
网上评测
https://www.wjx.cn/vj/O7S0dZA.aspx
以小组两个同学为单位,进行填写。
如需帮助,请观看“语音识别相关资料”文件夹中的评测视频
识别正确率的影响因素
1.对自然语言的识别与理解。
2.语音信息量太大。
3.语音的模糊性。
4.单个字母或者词、字的语音特性。受上下文的影响,以致改变重音、音调、音量和发音速度等。
5.环境噪声和干扰对语音识别有严重影响,致使识别率低。
课堂小结
1.语音识别过程
2.声学模型
3.语言模型
4.语音识别的实践
5.影响声音识别的因素
$$