第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册

2026-04-12
| 16页
| 217人阅读
| 4人下载
普通

资源信息

学段 初中
学科 信息科技
教材版本 初中信息科技浙教版八年级下册
年级 八年级
章节 第5课 语音识别技术
类型 课件
知识点 -
使用场景 同步教学-新授课
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PPTX
文件大小 1.08 MB
发布时间 2026-04-12
更新时间 2026-04-12
作者 Menth.Pan
品牌系列 -
审核时间 2026-04-12
下载链接 https://m.zxxk.com/soft/57306364.html
价格 0.50储值(1储值=1元)
来源 学科网

内容正文:

人工智能感知技术 语音识别 技术 让机器具备"听"的能力 八年级下册 第二单元 第5课 1 学习导航 本课我们要学什么? 01 生活感知 语音识别在身边 发现日常生活中的语音识别应用,感受技术的便利性 02 原理拆解 机器如何"听懂"我们说话 学习语音识别的基本原理和实现过程 03 实践验证 对照实验探究模型差异 通过实验验证不同模型对识别准确率的影响 04 价值升华 技术服务于人 体会语音识别技术的社会价值和人文关怀 准备好了吗?让我们开始探索语音识别的奥秘! 2 感知环节 语音识别生活大赏 视障人士 用语音读屏软件"听"手机内容,语音指令控制设备操作 "打开微信,给妈妈发消息" 老年群体 用语音发微信消息,不用打字就能和子女聊天 "儿子,晚上回家吃饭吗?" 司机群体 开车时用语音控制导航、打电话、播放音乐 "导航到火车站,播放音乐" 思考问题 你在日常生活中使用过哪些语音识别功能?你觉得好用吗? 3 现场小实验 同一段话,不同结果 实验材料 带方言口音的普通话 古诗《春晓》 三款识别工具 老旧识别软件 识别结果: "春眠不觉小,处处闻啼鸟..." 准确率:40% 手机自带输入法 识别结果: "春眠不觉晓,处处闻啼鸟..." 准确率:85% 专业在线平台 识别结果: "春眠不觉晓,处处闻啼鸟。 夜来风雨声,花落知多少。" 准确率:100% 核心问题 同一段话,为什么不同工具的识别结果不一样? 机器到底是怎么"听懂"我们说话的? 4 建构环节 什么是语音识别? 核心定义 语音识别是让机器具备 "听"的能力 ,将人类语音转换为机器可理解的文本信息的技术。 听 = 感知 识别 = 转换 AI的感知能力 语音识别是人工智能的感知类技术,就像人类的耳朵一样,让机器能够"听到"并理解我们的声音。 AI的三大感知能力:听、看、理解 转换过程 语音 处理 文本 回忆:我们在第一单元学过,人工智能的技术基础是 数据、算法、算力 。语音识别同样依赖这三大基础! 5 建构环节 语音识别的实现过程 1 数模转换 将模拟语音信号 转换为数字信号 声音→数字 2 预处理+特征提取 去除噪音干扰 提取关键特征 降噪→特征 3 声学模型 匹配发音特征 得到音素序列 发音→音素 4 语言模型 组合音素序列 输出文字文本 音素→文字 信号转换 特征提取 发音匹配 文字输出 什么是音素? 发音的最小单位,如"春"的发音可以分解为"ch"+"un" 核心要点 步骤3和4分别由声学模型和语言模型完成 6 类比学习 快递分拣类比理解 用我们熟悉的 "快递分拣" 场景来类比语音识别的全流程,把抽象的技术步骤转化为具象的生活逻辑! 1 数模转换 语音识别 语音信号 快递分拣 实体包裹 快递扫码录入系统 把实体包裹转化为系统可识别的数字信息 2 预处理+特征提取 语音识别 去除噪音 快递分拣 拆外包装 拆掉快递的外包装 去掉无效填充物,提取地址、大小等核心特征 3 声学模型匹配 语音识别 匹配音素 快递分拣 分城市站点 按地址前缀分到对应城市站点 匹配到发音的最小单位"音素" 4 语言模型匹配 语音识别 输出文本 快递分拣 送收件人 按详细地址送到收件人手中 把音素组合为概率最高的文字序列 通过这个类比,我们可以清晰地理解语音识别的四个步骤是如何协同工作的! 7 建构环节 声学模型:匹配发音的"专家" 核心功能 声学模型负责将语音信号匹配到发音的最小单位 "音素" 。 听发音 找音素 拼序列 工作原理 1 学习阶段:通过大量语音数据训练,学习不同发音的声学特征 2 识别阶段:将输入语音的特征与已学习的音素特征进行匹配 3 输出阶段:输出最可能的音素序列,供语言模型使用 实际示例 为什么"chun mian"会被识别为"春眠"? 声学模型通过学习大量语音数据,知道"chun"和"mian"的发音特征,能够准确匹配到对应的音素序列。 关键:声学模型的训练数据覆盖范围决定对不同口音、方言的识别能力! 重要:声学模型只负责 匹配发音 ,不负责理解语义!它不知道"春眠"是什么意思,只知道这个发音对应这两个音素。 8 建构环节 语言模型:理解文字搭配的"智者" 核心功能 语言模型负责将音素序列组合为 概率最高的文字序列 。 统计概率 计算搭配 选择最优 工作原理 1 学习阶段:通过海量文本数据训练,统计词汇的搭配概率 2 识别阶段:接收声学模型的音素序列,计算可能的文字组合 3 输出阶段:选择概率最高的文字序列作为识别结果 实际示例 为什么"chun mian"大概率是"春眠"? "春眠"的搭配概率 95% "纯棉"的搭配概率 5% 语言模型通过统计海量文本,知道"春眠"是古诗中的常见搭配,概率远高于"纯棉"! 重要:语言模型 不理解语义 ,只是通过统计概率选择最可能的文字组合。它不知道"春眠不觉晓"是什么意思,只知道这些字经常一起出现! 9 对照实验 实验1:口音对识别准确率的影响 实验设计 测试内容 "我明天要去植物园看樱花" 测试对象 同一人,用三种口音 识别工具 同一个通用识别平台 标准普通话 识别结果: "我明天要去植物园看樱花" 准确率:98% 带方言口音 识别结果: "我明天要去植物园看樱花" 准确率:75% 纯方言 识别结果: "我明天要去植物园看樱花" 准确率:35% 思考问题 为什么口音会影响识别结果?声学模型的训练数据起什么作用? 核心结论:声学模型的训练数据如果主要覆盖标准普通话,对带口音或方言的语音识别能力就会下降。训练数据的多样性决定了模型的适应能力! 10 对照实验 实验2:专业领域模型的优势 实验设计 测试内容 "我最近吃了硝苯地平控制血压" 测试对象 同一人,标准普通话 识别工具 通用平台 vs 医疗平台 通用识别平台 识别结果: "我最近吃了 消本地平 控制血压" 医学词汇识别错误 准确率:60% 原因分析:通用平台的语言模型训练数据主要是日常文本,缺少医学专业词汇的搭配概率统计。 医疗领域专用平台 识别结果: "我最近吃了 硝苯地平 控制血压" 医学词汇识别正确 准确率:98% 原因分析:医疗平台的语言模型训练了大量医学文本,专业词汇的搭配概率更高,识别更准确。 核心发现 为什么医疗平台能准确识别医学词汇?语言模型的训练数据差异是关键!专业领域的模型需要专业领域的训练数据。 11 核心发现 模型决定识别准确率 实验核心结论 不同 算法(模型) 的效率(准确率)存在显著差异! 声学模型 核心作用 匹配发音特征,将语音转换为音素序列 训练数据影响 训练数据的覆盖范围决定对不同口音、方言的识别能力 实验验证 标准普通话98% → 方言口音75% → 纯方言35% 语言模型 核心作用 统计词汇搭配概率,将音素组合为文字 训练数据影响 训练文本的类型决定对专业词汇、领域语言的识别准确率 实验验证 通用平台60% → 医疗平台98% 单元大概念 人工智能的技术基础为 数据、算法、算力 ,同一问题的不同算法(模型)存在效率(准确率)差异。语音识别是人工智能"听"的感知能力体现。 12 应用环节 实践任务:为视障老人设计语音工具 任务背景 假设你要为社区的 视障老人 设计一个语音留言转文字工具,帮助老人把自己想说的话转成文字发给外地的子女。 操作步骤 1 用开放平台工具录制一段给老人的操作提示语音 2 上传语音,完成识别操作 3 调整发音或更换平台,让识别准确率达到100% 示例提示语 "张奶奶,请点击屏幕中央的麦克风按钮,然后对着手机说出您想对儿子说的话,系统会自动转成文字发送。" 提示:注意语速适中,发音清晰,避免背景噪音 优化思考 如果要让这个工具更适配老人的使用需求,还可以优化语音识别的哪些环节? 13 应用环节 优化思考:如何更适配老人需求? 老年人使用语音识别的特点:可能有 方言口音 、习惯 口语化表达 、需要 简单操作 支持方言的声学模型 训练声学模型时加入更多方言数据,提高对方言口音的识别能力。 例如:支持粤语、四川话、东北话等 适配口语化的语言模型 训练语言模型时加入口语对话数据,理解日常口语表达习惯。 例如:"那个啥"、"挺好的"等口语 简化操作的界面设计 设计大按钮、语音引导、一键操作,降低使用门槛。 例如:自动开始录音、语音反馈结果 技术服务于人 语音识别技术让视障老人也能方便地和子女沟通,体现技术的温度。 技术应该让每个人都能平等享受便利 价值升华 语音识别技术不仅是冰冷的算法,更是 连接人与人之间的桥梁 ,让技术真正服务于人,温暖每个人的生活。 14 梳理环节 本课知识梳理 01 语音识别的定义 让机器具备 "听"的能力 将人类语音转换为机器可理解的文本信息 AI感知技术 语音→文本 02 实现过程(4步) 1 数模转换 2 预处理+特征提取 3 声学模型(音素) 4 语言模型(文本) 03 两个模型的作用 声学模型 匹配发音特征,输出音素序列 语言模型 统计搭配概率,输出文字文本 04 实践结论 开放平台可实现语音识别 模型决定识别准确率 训练数据影响模型效果 核心大概念 语音识别是人工智能的感知类技术,背后的核心支撑是 数据、算法、算力 ,不同模型的效果差异本质是算法和训练数据的差异。 15 课后作业 方言识别挑战 1 回家用不同的语音识别工具识别一段长辈说的家乡方言 2 记录每个工具的识别准确率 3 分析差异原因,思考声学模型的训练数据影响 4 下节课分享你的实验发现和思考 技术让生活更美好,下节课见! 16 $

资源预览图

第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
1
第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
2
第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
3
第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
4
第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
5
第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册
6
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。