第 5 课《语音识别技术》课件浙教版信息科技八年级下册

2026-04-12

| 16页

| 217人阅读

| 4人下载

普通

资源信息

学段	初中
学科	信息科技
教材版本	初中信息科技浙教版八年级下册
年级	八年级
章节	第5课语音识别技术
类型	课件
知识点	-
使用场景	同步教学-新授课
学年	2026-2027
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	PPTX
文件大小	1.08 MB
发布时间	2026-04-12
更新时间	2026-04-12
作者	Menth.Pan
品牌系列	-
审核时间	2026-04-12
下载链接	https://m.zxxk.com/soft/57306364.html
价格	0.50储值（1储值=1元）
来源	学科网

内容正文：

人工智能感知技术语音识别技术让机器具备"听"的能力八年级下册第二单元第5课 1 学习导航本课我们要学什么？ 01 生活感知语音识别在身边发现日常生活中的语音识别应用，感受技术的便利性 02 原理拆解机器如何"听懂"我们说话学习语音识别的基本原理和实现过程 03 实践验证对照实验探究模型差异通过实验验证不同模型对识别准确率的影响 04 价值升华技术服务于人体会语音识别技术的社会价值和人文关怀准备好了吗？让我们开始探索语音识别的奥秘！ 2 感知环节语音识别生活大赏视障人士用语音读屏软件"听"手机内容，语音指令控制设备操作 "打开微信，给妈妈发消息" 老年群体用语音发微信消息，不用打字就能和子女聊天 "儿子，晚上回家吃饭吗？" 司机群体开车时用语音控制导航、打电话、播放音乐 "导航到火车站，播放音乐" 思考问题你在日常生活中使用过哪些语音识别功能？你觉得好用吗？ 3 现场小实验同一段话，不同结果实验材料带方言口音的普通话古诗《春晓》三款识别工具老旧识别软件识别结果： "春眠不觉小，处处闻啼鸟..." 准确率：40% 手机自带输入法识别结果： "春眠不觉晓，处处闻啼鸟..." 准确率：85% 专业在线平台识别结果： "春眠不觉晓，处处闻啼鸟。夜来风雨声，花落知多少。" 准确率：100% 核心问题同一段话，为什么不同工具的识别结果不一样？机器到底是怎么"听懂"我们说话的？ 4 建构环节什么是语音识别？核心定义语音识别是让机器具备 "听"的能力，将人类语音转换为机器可理解的文本信息的技术。听 = 感知识别 = 转换 AI的感知能力语音识别是人工智能的感知类技术，就像人类的耳朵一样，让机器能够"听到"并理解我们的声音。 AI的三大感知能力：听、看、理解转换过程语音处理文本回忆：我们在第一单元学过，人工智能的技术基础是数据、算法、算力。语音识别同样依赖这三大基础！ 5 建构环节语音识别的实现过程 1 数模转换将模拟语音信号转换为数字信号声音→数字 2 预处理+特征提取去除噪音干扰提取关键特征降噪→特征 3 声学模型匹配发音特征得到音素序列发音→音素 4 语言模型组合音素序列输出文字文本音素→文字信号转换特征提取发音匹配文字输出什么是音素？发音的最小单位，如"春"的发音可以分解为"ch"+"un" 核心要点步骤3和4分别由声学模型和语言模型完成 6 类比学习快递分拣类比理解用我们熟悉的 "快递分拣" 场景来类比语音识别的全流程，把抽象的技术步骤转化为具象的生活逻辑！ 1 数模转换语音识别语音信号快递分拣实体包裹快递扫码录入系统把实体包裹转化为系统可识别的数字信息 2 预处理+特征提取语音识别去除噪音快递分拣拆外包装拆掉快递的外包装去掉无效填充物，提取地址、大小等核心特征 3 声学模型匹配语音识别匹配音素快递分拣分城市站点按地址前缀分到对应城市站点匹配到发音的最小单位"音素" 4 语言模型匹配语音识别输出文本快递分拣送收件人按详细地址送到收件人手中把音素组合为概率最高的文字序列通过这个类比，我们可以清晰地理解语音识别的四个步骤是如何协同工作的！ 7 建构环节声学模型：匹配发音的"专家" 核心功能声学模型负责将语音信号匹配到发音的最小单位 "音素" 。听发音找音素拼序列工作原理 1 学习阶段：通过大量语音数据训练，学习不同发音的声学特征 2 识别阶段：将输入语音的特征与已学习的音素特征进行匹配 3 输出阶段：输出最可能的音素序列，供语言模型使用实际示例为什么"chun mian"会被识别为"春眠"？声学模型通过学习大量语音数据，知道"chun"和"mian"的发音特征，能够准确匹配到对应的音素序列。关键：声学模型的训练数据覆盖范围决定对不同口音、方言的识别能力！重要：声学模型只负责匹配发音，不负责理解语义！它不知道"春眠"是什么意思，只知道这个发音对应这两个音素。 8 建构环节语言模型：理解文字搭配的"智者" 核心功能语言模型负责将音素序列组合为概率最高的文字序列。统计概率计算搭配选择最优工作原理 1 学习阶段：通过海量文本数据训练，统计词汇的搭配概率 2 识别阶段：接收声学模型的音素序列，计算可能的文字组合 3 输出阶段：选择概率最高的文字序列作为识别结果实际示例为什么"chun mian"大概率是"春眠"？ "春眠"的搭配概率 95% "纯棉"的搭配概率 5% 语言模型通过统计海量文本，知道"春眠"是古诗中的常见搭配，概率远高于"纯棉"！重要：语言模型不理解语义，只是通过统计概率选择最可能的文字组合。它不知道"春眠不觉晓"是什么意思，只知道这些字经常一起出现！ 9 对照实验实验1：口音对识别准确率的影响实验设计测试内容 "我明天要去植物园看樱花" 测试对象同一人，用三种口音识别工具同一个通用识别平台标准普通话识别结果： "我明天要去植物园看樱花" 准确率：98% 带方言口音识别结果： "我明天要去植物园看樱花" 准确率：75% 纯方言识别结果： "我明天要去植物园看樱花" 准确率：35% 思考问题为什么口音会影响识别结果？声学模型的训练数据起什么作用？核心结论：声学模型的训练数据如果主要覆盖标准普通话，对带口音或方言的语音识别能力就会下降。训练数据的多样性决定了模型的适应能力！ 10 对照实验实验2：专业领域模型的优势实验设计测试内容 "我最近吃了硝苯地平控制血压" 测试对象同一人，标准普通话识别工具通用平台 vs 医疗平台通用识别平台识别结果： "我最近吃了消本地平控制血压" 医学词汇识别错误准确率：60% 原因分析：通用平台的语言模型训练数据主要是日常文本，缺少医学专业词汇的搭配概率统计。医疗领域专用平台识别结果： "我最近吃了硝苯地平控制血压" 医学词汇识别正确准确率：98% 原因分析：医疗平台的语言模型训练了大量医学文本，专业词汇的搭配概率更高，识别更准确。核心发现为什么医疗平台能准确识别医学词汇？语言模型的训练数据差异是关键！专业领域的模型需要专业领域的训练数据。 11 核心发现模型决定识别准确率实验核心结论不同算法（模型）的效率（准确率）存在显著差异！声学模型核心作用匹配发音特征，将语音转换为音素序列训练数据影响训练数据的覆盖范围决定对不同口音、方言的识别能力实验验证标准普通话98% → 方言口音75% → 纯方言35% 语言模型核心作用统计词汇搭配概率，将音素组合为文字训练数据影响训练文本的类型决定对专业词汇、领域语言的识别准确率实验验证通用平台60% → 医疗平台98% 单元大概念人工智能的技术基础为数据、算法、算力，同一问题的不同算法（模型）存在效率（准确率）差异。语音识别是人工智能"听"的感知能力体现。 12 应用环节实践任务：为视障老人设计语音工具任务背景假设你要为社区的视障老人设计一个语音留言转文字工具，帮助老人把自己想说的话转成文字发给外地的子女。操作步骤 1 用开放平台工具录制一段给老人的操作提示语音 2 上传语音，完成识别操作 3 调整发音或更换平台，让识别准确率达到100% 示例提示语 "张奶奶，请点击屏幕中央的麦克风按钮，然后对着手机说出您想对儿子说的话，系统会自动转成文字发送。" 提示：注意语速适中，发音清晰，避免背景噪音优化思考如果要让这个工具更适配老人的使用需求，还可以优化语音识别的哪些环节？ 13 应用环节优化思考：如何更适配老人需求？老年人使用语音识别的特点：可能有方言口音、习惯口语化表达、需要简单操作支持方言的声学模型训练声学模型时加入更多方言数据，提高对方言口音的识别能力。例如：支持粤语、四川话、东北话等适配口语化的语言模型训练语言模型时加入口语对话数据，理解日常口语表达习惯。例如："那个啥"、"挺好的"等口语简化操作的界面设计设计大按钮、语音引导、一键操作，降低使用门槛。例如：自动开始录音、语音反馈结果技术服务于人语音识别技术让视障老人也能方便地和子女沟通，体现技术的温度。技术应该让每个人都能平等享受便利价值升华语音识别技术不仅是冰冷的算法，更是连接人与人之间的桥梁，让技术真正服务于人，温暖每个人的生活。 14 梳理环节本课知识梳理 01 语音识别的定义让机器具备 "听"的能力将人类语音转换为机器可理解的文本信息 AI感知技术语音→文本 02 实现过程（4步） 1 数模转换 2 预处理+特征提取 3 声学模型（音素） 4 语言模型（文本） 03 两个模型的作用声学模型匹配发音特征，输出音素序列语言模型统计搭配概率，输出文字文本 04 实践结论开放平台可实现语音识别模型决定识别准确率训练数据影响模型效果核心大概念语音识别是人工智能的感知类技术，背后的核心支撑是数据、算法、算力，不同模型的效果差异本质是算法和训练数据的差异。 15 课后作业方言识别挑战 1 回家用不同的语音识别工具识别一段长辈说的家乡方言 2 记录每个工具的识别准确率 3 分析差异原因，思考声学模型的训练数据影响 4 下节课分享你的实验发现和思考技术让生活更美好，下节课见！ 16 $

第 5 课 《语音识别技术》课件 浙教版信息科技八年级下册

资源信息

内容正文：

资源预览图

第 5 课《语音识别技术》课件浙教版信息科技八年级下册