内容正文:
语音识别技术
小夜灯是通过什么方式听懂我们人说的指令?
像这样,把语音转换成文本的技术就叫语音识别技术
建构:原理探究一
现实世界
数字世界
我们怎样做才能让数字世界的计算机听得见现实世界的声音?
声音数字化
耳朵
1.声音数字化
探究一:
1.操作员:打开"语音识别资源包"文件夹内的"数字化.py",操作。
记录员:打开"语音识别资源包"文件夹内的"数字化(操作指南)"指导。
2.运行代码,录制一段5秒带有"开灯或关灯"指令的语音。
3.再次打开"数字化.py",尝试调节"数字化.py"的采样率、量化参数,重新录制一次相同的指令语音。
4.小组观察比较两次语音的音质,哪种好?
根据调节参数,本组发现:
采样频率越 ,音质越 ,量化位数越 ,音质越 ,文件越 。
高
低
好
大
建构:原理探究二
我们怎样做才能让数字世界的计算机听得清现实世界的声音?
2.特征提取
探究二:
1.操作员:负责打开"2-特征对比实验工具",操作。
记录员:打开"2-特征对比实验工具(操作指南)",指导。
2.小组观察比较声音特征:
(1)同一人,发同个音:音频源1与音频源2的声音特征(波形)
(2)同一人,发不同音:音频源1与音频源2的声音特征(波形)
(3)同组2人,发同个音:音频源1与音频源2的声音特征(波形)
小组讨论思考:特征与声音的哪些量有关?
音调(声调、腔调)、音长(声音的持续时间)、音高(声音的高低)
建构:原理探究三
我们怎样做才能让数字世界的计算机听得懂现实世界的声音?
音素是根据语音的自然规律划分出的最小的语音单位。
我们是怎么学习普通话的?
最小的语音单位开始
声音模型:声音库
语音
特征
建构:原理探究三
3.声音模型及模型匹配
探究三:
1.操作员:打开"3-声学训练",操作。
完成(声母a1、a2)的声音模型模拟训练。保存音频
和对应的特征(波形)到"声学模型:声音库"文件夹
记录员:打开"3-声学训练(操作指南)",指导。
建构:原理探究四
我们怎样做才能让数字世界的计算机识得出现实世界的语言文字?
4.语言处理
探究四:
1.打开"4-语言模型"文件夹内的"语言模型.py",运行程序,尝试体验识别的准确率。
2.小组讨论思考:识别的准吗?如果识别不准,是什么原因?
3.我们的猜想:我们可以怎样做提高识别的准确率?
an
u
归纳梳理
声音数字化
特征提取
模式匹配
声学模型
语言模型
语言处理
识别结果
g
音素序列
guan1 deng1
d
eng
1.假如用方言说“开灯或关灯”,小夜灯是否还能听得懂指令吗?
探究五:
2.如果不能,排除硬件故障之外,问题出在识别过程的哪个环节?
3.小组讨论,我们应该怎么做?
应用迁移
Lavf60.16.100
null
2612.2463
$$