9.8 随机抽样、用样本估计整体-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版

2025-12-31
| 2份
| 11页
| 65人阅读
| 2人下载
教辅
河北红对勾文化传播有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 随机抽样,用样本估计总体
使用场景 高考复习-一轮复习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.33 MB
发布时间 2025-12-31
更新时间 2025-12-31
作者 河北红对勾文化传播有限公司
品牌系列 红对勾·高考大一轮复习讲与练全新方案
审核时间 2025-12-31
下载链接 https://m.zxxk.com/soft/55726168.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

决赛”为事件B,则P(A)=, 3 P(B)=3 1 因为每个人是否进入歌手大赛决赛和 达人秀决赛互不影响, 所以事件A和事件B相互独立, 所以甲两个比赛都进入决赛的概率为 3 4 故甲两个比赛都进入决赛的概率 (2)X的可能取值为0,1,2,3,且 X~B,) 则P(X=0)= c()()- 27 4 P(X=1)= c()广() 64 P(X=2)= c()'() 64 P(X=3)= c()广() 二64 故随机变量X的分布列为 X 0 1 3 27 27 9 1 P 64 64 64 64 所以E(X)=0X 27 +1× 27 +2× 64 64 3 6+3×6 41 例3解:(1)由题意知,X所有可能的取 值为1,2,3,4, CC P(X=1)= 30 CC P(X=2)= 3 C1。 CC 1 P(X=3)= Clo P(X=4)= 二6 所以X的分布列为 X 1 3 1 3 1 1 30 10 2 6 (2)X的期望E(X)=1×30+2× 3 1 14 0+3×2+4×6=5 又E(X)=1× 1 30+4X+9×2 十 42 16×6 5 故方差D(X)=E(X)-(E(X)) 对点训练3解:(1)由题意易知X的可 能取值为0,1,2,3, 则p(X=o)=C =19P(X= 1)= CoCi。 C2o 15,P(x=2)= 38 C1。C1.1 38P(X=3)= 2 C。 19' 则X的分布列为 X 0 1 2 3 2 15 15 P 2 19383819 (2)由题意易知的可能取值为0,1, 2,3,4, 21 则P(=0)= 16 =87P(=1)= C×23 C×22 31 31 87=27,P(g=3)= 24 8 8 31 P(=4)= C 1 31 =81 则专的分布列为 0 2 3 16 32 8 8 P 8181278181 例4AD观察题图可以看出,甲地数学 平均分为90,小于乙地数学的平均分 100,A正确:题图中还可以看出乙地数 据更加集中,故乙地方差更小,B错误; 根据对称性,P(90≤X<94)= P(86<X≤90)<P(82≤X<90), C错误;o2=8时,根据题千数据, P(92Y≤108)≈0.6827,根据对称 性,P(92<Y≤10)≈0.6827,另有 2 P(76Y≤124)≈0.9973,根据对称 性,P10<Y≤124≈0.9973,于是 2 P(92Y<124) 0.9973+0.6827 2 0.84,D正确.故选AD. 对点训练4(1)3 解析:由题意可知,正态曲线的对称轴 为直线x=1,由正态曲线的对称性可 得a+a21=2>a= 5 2 (2)8 解析:由题意可知,正态曲线关于直线 x=10对称,所以P(x>17)= P(x<3)=m,所以m十n=2,因为 m2十n2≥2mn,得2(m2十n2)≥m2+ n+2n,得m2十n≥之(m十n) ×()=,当且仅当m=n 1 年时等号成立,所以m十的最小值 为8 例50.1359 解析:因为X~N(100,2),即4= 100,0=2,所以P(102≤X≤104)= P(十g≤X≤十2a)=2X 1 [P(u-2G≤X≤h+2G)-P(u- 0X以十6)]≈ 0.9545-0.6827=0.1359.即这名 学生数学成绩在区间[102,104]内的 概率约为0.1359. 对点训练5①② 解析:对于①,因为P(Y>45)= z1-P(21≤Y≤45)]≈2×1- 0.9973)=0.00135,即乘坐线路B, 18:02后到家的概率为0.00135,所以 乘坐线路B,18:00前不一定能到家, 所以①错误:对于②,乘坐线路A在 17:58前到家的概率为P(X<48)= 21-P(40≤X≤48)]+P(40≤X< ×1-0.9545)+0.9545= 48)≈2 0.97725,乘坐线路B在17:58前到家 的概率为PY<41)=2[1 P(25Y41)]+P(25≤Y ×(1-0.9545)+0.9545= 41)≈2 0.97725,所以乘坐线路A和乘坐线路 B在17:58前到家的可能性一样,所以 ②错误;对于③,乘坐线路A在17:54 前到家的概率为P(X<44)=弓,乘 坐线路B在17:54前到家的概率为 PY<3)=21-P(9≤Y< 87J+P(29≤Y<37)≈2×1 0.6827)+0.6827=0.84135>2 所以乘坐线路B比乘坐线路A在 17:54前到家的可能性更大,所以③正 确;对于④,乘坐线路A在17:48前到家 的概率为P(X<38)=1-P(8≤ X≤50)]≈2 1 ×(1-0.9973)= 0.00135<0.01,所以④正确.故不合 理的为①②. 9.8 随机抽样、用样本 估计总体 …》回顾·必备知识《 知识梳理 1.(1)相等(2)抽签法随机数法 2.(1)简单随机抽样分层随机抽样 (3)各层平均数 3.(2)①极差②组距组数③数据 4.(2)②中间 平均数③最多 考教衔接 C根据频数分布表可知,6十12十 18=36<50,所以亩产量的中位数不 小于1050kg,故A错误;亩产量不低 于1100kg的频数为24十10=34,所 以亩产量低于1100kg的稻田占比为 参考答案503 100-34=66%,故B错误:稻田亩产 100 量的极差最大值小于1200一900= 300(kg),最小值大于1150-950= 200(kg),故C正确;由频数分布表可 得这100块稻田亩产量的平均值的最 小值为10×(6X900+12×950十 18×1000+30×1050+24×1100+ 10×1150)=1042(kg),故D错误.故 选C 基础检测 1.(1)√(2)×(3)×(4)/ 2.39 3.54 解析:前两组的频数为100×(0.05十 0.11)=16,因为后五组的频数和为 64,所以前三组的频数和为36,所以第 三组的频数为36一16=20,又最大频 率为0.34,故第四组的频数为0.34× 100=34,所以a=20十34=54. 4.20 解析:由于数据x1,x2,x3,x1,x5的 方差为5,所以数据2x1-3,2x2-3, 2x3一3,2x1一3,2x5一3的方差为 22×5=20. 5.BCD对于A,由题图知10×(x十 0.015+0.020+0.030+0.025)=1, 解得x=0.010,故A错误;对于B,成 绩在[50,80)内的频率为0.1十0.15十 0.2=0.45<0.6,成绩在[50,90)内 的频率为0.1十0.15十0.2十0.3= 0.75>0.6,因此第60百分位数m位 于区间[80,90)内,m=80 0.6-0.45× 0.3 (90一80)=85,所以估计样本数据的 第60百分位数约为85,故B正确;对于 C,平均数约为x=55×0.1十65× 0.15+75×0.2+85×0.3+95× 0.25=79.5(分),故C正确;对于D,成 绩低于80分的三组学生的人数之比为 0.1:0.15:0.2=2:3:4,则应抽取成 绩在[60,70)内的学生人数为30× 2+3+4=10,故D正确.故选BCD. 3 》提升·关键能力《… 例1(1)D对于A,平面直角坐标系中 有无数个点,这与要求总体中的个体 数有限不相符:对于B,老师表杨的是 发言积极的,对每一个个体而言,不具 备“等可能性”:对于C,错在总体容量是 无限的.故选D. (2)09 解析:依题意,得到的样本编号依次为 14,05,11,09,…,则第4个样本编号 是09. 11 对点训练11010 解析:在抽样过程中,个体a每一次被 抽中的可能性是相等的,因为总体容 量为10,故个体a“第一次被抽到”的 可能性与“第二次被抽到”的可能性均 为0 504红对构·讲与练·高三数学· 例2(1)D根据比例分配的分层随机抽 样的定义知初中部共抽取60X400 600 200 40(人),高中部共抽取60×600 20(人),根据组合公式和分步乘法计 数原理得不同的抽样结果共有C8。· C20种.故选D. (2)B设中年人抽取x人,青少年抽 取y人,由比例分配的分层随机抽样可 知200 .x80 40=36'480三6,解得x=1正 y=6,故中年人比青少年多抽取9人 故选B. 对点训练2BCD从中随机抽取60家商 店,则样本容量为60,B正确;因为三种 类型的商店的数量之比为1:5:9,所 以大、中、小型商店分别抽取4家、 20家、36家,且20-4=16(家),A错 误,C正确;被抽取的60家商店每日的 零售额情况是所抽取的一个样本, D正确.故选BCD. 例3(1)CD对于A,若第一组的平均数 为x,第二组的平均数为y,则y=x十 c,且c≠0,故平均数不相同,故A错 误;对于B,若第一组的中位数为x;,则 第二组的中位数为y:=x,十c,显然 不相同,故B错误;对于C,若第一组的 方差为s1,第二组的方差为s,则s= s,故方差相同,即标准差相同,故C正 确;对于D,由极差的定义知,若第一组 的极差为xmx一xmm,则第二组的极差 为ymx一ymin=(xnas十c)一(xms十 C)=工mx一xmm,故极差相同,故D正 确.故选CD. (2)BD设x2,x3,x1,x5的平均数为 m,x1,x2,…,x6的平均数为n,则n m=1十xg十x3十x1十x;十x6 6 x,十x3十x1十x5= 2(x1十x6)一(x2十x3十x1十x5) 12 因为无法确定2(x1十xB)与x2十x3十 x1十x5的大小关系,所以无法判断, n的大小,故A错误;不妨设x1≤ x2≤x3≤x1≤x5≤x6,可知x2, xx1x5的中位数等于x1,x2, 工6的中位数,均为十,故B正确: 2 因为x1是最小值,x:是最大值,则 x2x,x1x5的波动性不大于x1, x2,…,x6的波动性,即工2x,x1x5 的标准差不大于x1x2,…,x6的标准 差,故C错误;不妨设x1≤x2≤x3≤ x1≤x:≤x6,则x6一x1≥x5一x2, 当且仅当x1=x2x5=x6时,等号成 立,故D正确.故选BD. 对点训练3解:1)x=0X(9.8+ 10.3+10.0+10.2+9.9+9.8+ 10.0+10.1+10.2+9.7)=10,y 0×(10.1+10.4+10.1+10.0+ 10.1+10.3+10.6+10.5+10.4+ 10.5)=10.3,si=10 1 ×(0.22+ 基础版 0.32+0+0.22+0.12十0.22十0十 0.12+0.22+0.32)=0.036,s= 0×(0.2+0.1+0.2+0.32+ 0.22+0+0.32+0.22+0.12+ 0.2)=0.04. (2)依题意,y-x=0.3=2×0.15= 2×√0.15=2√0.0225, /0.036+0.04 =2√0.0076,所 10 以y-x>2 十5,所以新设备生 10 产产品的该项指标的均值较旧设备有 显著提高。 例4C24×25%=6,所以这24户居民 的月均用水量的第25百分位数为 5.5+6.7 =6.1(t).故选C 2 对点训练46 解析:由题知该组数据的极差为17 2=15,中位教为m十12,所以m十12 2 2 3 15×5 =9→m=6,又6×40%= 2.4,所以该组数据的第40百分位数是 该组数据的第三个数,为6. 例5D设[70,80)组的频率为a,则由 各组频率之和为1,可得10×(0.01 0.02+0.03+0.02)+a=0.8+a= 1,解得a=0.2,则[50,60),[60,70), [70,80),[80,90),[90,100]各组频率 依次为0.1,0.2,0.2,0.3,0.2,[80, 90)组频率最大,即成绩在[80,90)上 的人数最多,故A正确:成绩低于70分 的学生频率为0.1十0.2=0.3,即不低 于70分的学生频率为1一0.3=0.7, 所以成绩不低于70分的学生所占比例 为70%,故B正确;根据频率分布直方 图,可得50名学生成绩的平均数是 55×0.1+65×0.2+75×0.2+85× 0.3十95×0.2=78(分),由0.1 0.2十0.2=0.5,故50名学生成绩的中 位数为80分,所以50名学生成绩的平 均数小于中位数,故C正确:极差为数 据中最大值与最小值的差,已知50名 学生的成绩都在区间[50,100]内,但 成绩的最大值不一定是100分,最小值 也不一定是50分,故极差小于或等于 50分,但不一定等于50分,故D错误. 故选D. 对点训练5解:(1)由每个小矩形的面积 之和为1,得0.05+0.1十0.2+10a十 0.25+0.1=1,解得a=0.030. (2)成绩落在[40,80)内的频率为 0.05十0.1十0.2十0.3=0.65,落在 [40,90)内的频率为0.05+0.1十 0.2+0.3+0.25=0.9, 显然第75百分位数m∈[80,90),由 0.65十(1-80)×0.025=0.75,解得 m=84, 所以样本成绩的第75百分位数为84分. (3)由频率分布直方图知,成绩在[50, 60)的人数为100×0.1=10, 成绩在[60,70)的人数为100×0.2= 20,所以:=10×56+20×65= 10+20 62(分): 由样本方差计算总体方差公式,得总 方差为s2= {10×7+(56 10+20 62)2]+20×[4+(65-62)2]}=23. 聚焦学科素养 题目呈现1ABD2024年第一季度全市 居民人均消费支出为2084十453十 1435+356+791+583+528+163= 6393(元),故A正确;易知居住及食品 烟酒两项的人均消费支出总和为 2084+1435=3519(元),占总人均 消竟支出的3519 ×100%≈55.0%> 6393 50%,故B正确:依题意可得2023年第 一季度城乡居民人均消费支出的差额 为79244388」 1.0441.078≈3520(元),2024年 第一季度城乡居民人均消费支出的差 额为7924-4388=3536(元),由于 3520<3536,故C错误;医疗保健与 教育文化娱乐两项人均消费支出总和 占总人均消费支出的528+791 ×100%≈ 6393 20.6%,故D正确.故选ABD 题目呈现2AB亲子阅读占比71.08%, 为最大,A正确:由于71.08%十 52.66%-1=23.74%>20%,B正 确;题图中各类亲子活动占比的中位数 为 27.77%+40.14% =33.955%, 2 C错误:题图中10类亲子活动占比的 极差为71.08%-13.32%=57.76%, D错误.故选AB. 题目呈现3D①由题图可得这13个月 的PMI的最大值为52.6%,最小值为 47.0%,所以极差为52.6%一47.0% 5.6%,故①正确;②由题图可得2023 年1月到2023年3月的PMI分别为 50.1%,52.6%,51.9%,均大于50%, 故②正确:③从2023年1月到2023年 7月的PMI的值从小到大排列为48.8%, 49.0%,49.2%,49.3%,50.1%,51.9%, 52.6%,因为7×75%=5.25,所以这 7个月的PMI的第75百分位数为第六 个数51.9%,故③正确:④2023年7月 的PMI为49.3%,6月的PMI为 49.0%,所以比上月上升0.3个百分点, 故④正确.所以正确的个数为4.故选D. 题目呈现4C由题图可知,2024年母 亲周末陪伴孩子日均时长超过8小时 的占比为38.7%>3,A说法正确, 2024年父亲周末陪伴孩子日均时长超 过6小时的占比为31.5%+24.2%= 55.7%>2,B说法正确:2024年母亲 周末陪伴孩子日均时长的5个时段占 比的极差为38.7%一2.5%=36.2%, C说法错误;2024年父母周末陪伴孩子 日均时长的10个时段占比的中位数为 21.4%十19.0% =20.2%,D说法正 2 确.故选C. 题目呈现5D2021一2024年该国星级 酒店数量依次为8920,8423,7676, 7337,逐年减少,故A正确:2021—2024 年该国星级酒店营业收入最高为 1907.77亿元,故B正确:2021一2024 年该国星级酒店餐饮收入比重最高的 是2022年,故C正确:2021一2024年该 国星级酒店餐饮收入比重的极差是 41.63%一38.19%=3.44%,故D错 误.故选D. 9.9 成对数据的统计分析 》回顾·必备知识《 知识梳理 1.(1)有关系(2)增加减小 (3)一条直线 2.(2)正相关负相关(3)强 弱 3.(2)预测值 4.(2)是否独立 基础检测 1.(1)/(2)×(3)X 2.y=c·dr(c,d>0) 解析:根据散点图判断,用y=c· d严(c,d>0)的拟合效果更好. 3.97.5 解析:由已知可得X2=6.109 5.024,所以市政府断言市民收入增减 与旅游需求有关的可信度是97.5%. 4.12 解析:设被调查的男性人数为k,依题 意,得2×2列联表如下: 足球 性别 合计 喜爱 不喜爱 5k 男性 k 6 6 女性 2k 4k 2k 3 3 合计 3k 3k 3k 2 2 4k 6 则X”= 3 6 3k 3k k·2k·2 ·2 ,因为本次调查得出“在犯错误的概 2k 率不超过0.005的前提下认为喜爱足 球与性别有关”的结论,于是X≥ 7.879,即2 ≥7.879,解得k≥11.8185, 而k=61,m∈N,因此km=12. 5.BC对于A,样本相关系数r的绝对 值越大,则成对样本数据的线性相关 程度越强,故A错误:对于B,经验回归 直线一定经过点(x,y),故B正确;对 于C,决定系数R的值越接近1,则经 验回归方程拟合效果越好,故C正确; 对于D,残差平方和越小,表示经验回 归方程拟合效果越好,故D错误.故 选BC. 》提升·关键能力《… 例1D第一个散,点图中的,点是从左下 角区域分布到右上角区域,则是正相 关:第三个散点图中的点是从左上角 区域分布到右下角区域,则是负相关; 第二个散点图中的点的分布没有什么 规律,则是不相关,所以应该是 ①③②.故选D. 对点训练1A由题中散,点图可以看 出,题图1和题图3是正相关,样本相 关系数大于0,题图2和题图4是负相 关,样本相关系数小于0,题图1和题图 2的,点相对更加集中,所以线性相关性 更强,所以r1更接近1,r2更接近一1,由 此可得r2<r1<0<r3<r1.故选A 例2(1)C因为沿海地区气温和海水表 层温度相关,且样本相关系数为正数, 故随着沿海地区气温由低到高时,海 水表层温度呈上升趋势,故选C (2)B残差图越宽,说明模型的拟合 效果越差,故A错误;残差平方和越 小,说明模型的拟合效果越好,故B正 确;决定系数R2越小,说明模型的拟合 效果越差,故C错误:样本相关系数” 的绝对值越大,两个变量的线性相关 性越强,故D错误.故选B. 对点训练2(1)DR越大,则回归模型 的拟合效果越好,因为0.56>0.45> 0.23>一0.79,所以拟合效果最好的是 模型丁.故选D. (2)BD由r越接近1,数据的线性 相关关系越强知,A错误,B正确:由残 差平方和越小,则数据的线性回归模 型拟合效果越好知,C错误;由决定系 数越大,则数据的线性回归模型拟合 效果越好知,D正确.故选BD. 例3解:(1)由统计图的数据,可得x 2士3+4十6+8+10+8-5≈7, y=18+22+31+42+50+56+58- 7 222≈39: 7 又由∑(x,-x)(y,-y)=395, ∑x,-=97, 所以6- ≈4,a=y-bx≈39- 4×7=11, 所以y关于x的经验回归方程为y= 4x+11. (2)由统计图中的数据以及(1)中的经 验回归方程,可得统计表如下: x 2 3 4 6 81013 y 13 22 37 42 50 56 58 19 23 27 35 51 63 残差一 6 -5 所以该组数据残差的平方和为(一6)+ (-1)2+42+72+72+52+(-5)2= 201. 对点训练3解:(1)由表中数据可知, x- 5×(1+2+3+4+5)=3,y= 5×(3+7+9+10+11)=8 ∑(x,-x)2=10,∑0y,-y)2= =1 i=1 40,∑(x,-元)(y,-)=19, i=1 则x= ∑(x,-x)(0y,- =1 (y,-y) N=1 19 =0.95>0.75, √10×2√/10 故研发投入与产品收益的相关程度 较强. 参考答案505246对构·讲与练·高三数学·基础版 正态分布N(100,2).从本市中任选1名高二 间X(单位:分钟)服从正态分布N(44,2),下 学生,则这名学生数学成绩在区间[102,104] 车后步行到家要5分钟;乘坐线路B所需时间 内的概率约为 Y(单位:分钟)服从正态分布N(33,4),下车 参考数据:若随机变量X~N(μ,o2),则 后步行到家要12分钟.从统计角度分析,下列 P(H-o≤X≤k+o)≈0.6827,P(u 说法不合理的是 (填序号) 第 2o≤X≤h+2o)≈0.9545,P(u-3o≤ 参考数据:若Z~N(,o),则P(一o< X≤4十3o)≈0.9973. Z<4+o)≈0.6827,P(4-2o<Z<4十 章 学生试答: 2o)≈0.9545,P(u-3o<Z<h+3o)≈ 0.9973. ①若乘坐线路B,18:00前一定能到家; ②乘坐线路A比乘坐线路B在17:58前到家 的可能性更大; ③乘坐线路B比乘坐线路A在17:54前到家 规律总结 的可能性更大; 由以,0分布区间的特征进行转化,使分布区间 ④若乘坐线路A,则在17:48前到家的可能性 转化为3σ特殊区间,从而求出所求概率.注意标准 不超过1% 正态分布下对称轴为直线x=0. 》温馨提示 【对点训练5】老张每天17:00下班回家,通常步 行5分钟后乘坐公交车再步行到家,公交车有 学习至此,请完成训练65 A,B两条线路可以选择,乘坐线路A所需时 9.8 随机抽样、用样本估计总体 考试 1.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.2.理解统计图表的含义.3.会用统 要求 计图表对总体进行估计,会求n个数据的第力百分位数.4.能用数字特征估计总体集中趋势和总体离 散程度 回顾 》必备知识 》知识梳理《 一起作为总样本,这样的抽样方法称为 ,每一个子总体称为层 1.简单随机抽样 (2)适用范围:总体可以分层,且层与层之间有 (1)特点:逐个抽取,且每个个体被抽取的概 明显区别,而层内个体差异较小 率 (3)平均数的计算:各层抽样比乘 (2)常用方法: 和 的和. (3)适用范围:个体性质相似,无明显层次,且个 3.统计图表 体数量较少,尤其是样本容量较小 (1)常见的统计图有条形图、扇形图、折线图、频 2.分层随机抽样 率分布直方图等, (1)定义:一般地,按一个或多个变量把总体划 (2)作频率分布直方图的步骤 分成若干个子总体,每个个体属于且仅属于 ①求 个子总体,在每个子总体中独立地进行 ②决定 与 ,再把所有子总体中抽取的样本合在 ③将 分组: 第九章 概率与统计 247 ④列频率分布表; (2)若数据2x1,x2,…,xm的方差为s2,则 ⑤画频率分布直方图. ①数据x1十a,x2十a,…,xn十a的方差为s2; 4.用样本估计总体 ②数据a.x1,ax2,…,a.xn的方差为a2s2 (1)百分位数 考教衔接 一般地,一组数据的第力百分位数是这样一个 【高考这样考】 值,它使得这组数据中至少有p%的数据小于 (2024·新课标Ⅱ卷)某农业研究部门在面积相等 第 或等于这个值,且至少有(100一p)%的数据大 的100块稻田上种植一种新型水稻,得到各块稻 九 于或等于这个值: 田的亩产量(单位:kg)并整理得下表: 章 (2)平均数、中位数和众数 [900, [950, 1000,1050,1100,L1150 ①平均数7=((x1十十十t). 亩产量 950)1000)1050)1100)1150)1200) n 频数 6 12 18 30 24 10 ②中位数:将一组数据按从小到大或从大到小 的顺序排列,处在最 的一个数据(当数 根据表中数据,下列结论中正确的是 据个数是奇数时)或最中间两个数据的 A.100块稻田亩产量的中位数小于1050kg B.100块稻田中亩产量低于1100kg的稻田所占 (当数据个数是偶数时). 比例超过80% ③众数:一组数据中出现次数 的数据 C.100块稻田亩产量的极差介于200kg至300kg (即频数最大值所对应的样本数据). 之间 (3)方差或标准差 D.100块稻田亩产量的平均值介于900kg至 0方差:s=之(x-x)或 1 1000kg之间 n-1 x号-元2 n= 【教材这样教】 (人教A版必修第二册P225复习参考题9第8题) ②标准差:5= 1 (x-x)2 一名学生通过计步仪器,记录了自己100天每天 (4)总体(样本)方差 走的步数,数据如下: 5678130398666…98588922 ①一般式:如果总体中所有个体的变量值分别 12682(部分数据省略) 为Y,Y2,…,YN,总体平均数为Y,则总体方差 (1)画出这组数据的频率分布直方图,并分析数据 为s- N2,- 的分布特点; (2)计算这组数据的平均数、中位数和标准差,并 ②加权式:如果总体的N个变量值中,不同的 根据这些数值描述这名学生的运动情况, 值共有(k≤N)个,不妨记为Y,Y2,…,Yk, 衔接解读:试题以某生产问题的频数分布表为 其中Y,出现的频数为f,(i=1,2,…,k),则总体 载体,主要考查对频数分布表的理解和统计数据的 1 分析,计算相关的样本数字特征并理解其包含的统 方差为S2= 21- 计意义,考查学生的数据分析、逻辑推理、数学运算 等核心素养.高考试题是以频数分布表为背景,教材 ○常用结论与知识拓展 的习题则是先绘制频率分布直方图,再研究其样本 1.频率分布直方图与众数、中位数、平均数的关系 的数字特征,而绘制频率分布直方图必须先得到频 (1)最高的小长方形底边中点的横坐标即是众数. 数分布表.因此在教学过程中,要注重“基本功”的锤 (2)中位数左边和右边的小长方形的面积和是相等的. 炼与夯实,切勿浅尝辄止. (3)平均数是频率分布直方图的“重心”,等于频率 分布直方图中每个小长方形的面积乘小长方形底边中 》基础检测《 点的横坐标之和. 1.判断下列命题是否正确,正确的在括号内画 2.平均数、方差公式的推广 “/”,错误的画“X” (1)若数据x1x2,…,xm的平均数为x,则mx1十a, (1)简单随机抽样每个个体被抽到的机会一样, mx2十a,m.xa十a,,mxm十a的平均数是mx十a. 与先后无关。 () 248亿对构·讲与练·高三数学·基础版 (2)在比例分配的分层随机抽样中,每个个体被4.(教材改编题)已知数据x1,x2,x3,x4,x5的方 抽到的可能性与层数及分层有关, ( 差为5,则数据2x1-3,2x2-3,2x3一3,2x4 (3)若样本量n=100,则第75百分位数是从小 3,2x5一3的方差为 到大排列的第75个数. () 5.(多选题)(教材改编题)某校组织“校园安全”知 (4)频率分布直方图中,小长方形的面积越大,表 识测试,随机调查600名学生,将他们的测试成 示样本数据落在该区间的频率越大.() 第 绩(满分100分,单位:分)按照[50,60),[60, 2.(教材改编题)在一次篮球比赛中,某支球队共 70),…,[90,100]分成五组,得到如图所示的频 章 进行了8场比赛,得分(单位:分)分别为29,30, 率分布直方图,则下列说法正确的是 38,25,37,40,42,32,那么这组数据的第75百分 ↑频率 位数为 组距 0.030 3.(教材改编题)为了了解某校高三学生的视力情 0.025 况,随机抽查了该校100名高三学生的视力情 0.020 况,得到频率分布直方图如图所示,由于不慎将 0.015 部分数据丢失,但知道后五组的频数和为64,最 大频率为0.34,设视力在4.6到4.8之间的学生 人数为a,则a的值为 0V5060 708090100成绩/分 频率 A.图中x=0.100 组距 B.估计样本数据的第60百分位数约为85 C.若每组数据以所在区间的中点值为代表,则 这600名学生成绩的平均数约为79.5分 D.若用按比例分配的分层随机抽样的方法抽取 1.1 30名成绩低于80分的学生,则成绩在[60, 0.5 70)内的学生应抽取10人 04.44.54.64.74.84.95.05.15.2视力 提升 关键能力 考点1简单随机抽样与分层随机抽样 666740371464057111056509958668 7683203790 命题角度1简单随机抽样 571603116314908445217573880590 【例1】(1)下列抽样方法是简单随机抽样的是 5223594310 若从表中第1行第9列开始向右依次读取数 A.从平面直角坐标系中抽取5个点作为样本 据,则得到的第4个样本编号是 B.“隔空不隔爱,停课不停学”,网课上,李老师 幻学生试答: 对全班45名学生中发言积极的3名学生进 行了表扬 C.老师要求学生从实数集中逐个抽取10个数 分析奇偶性 D.某运动员从8条跑道中随机抽取一条跑道 规律总结 试跑 1.简单随机抽样需满足:①被抽取的样本总体 (2)某工厂利用随机数表对生产的50个零件 中的个体数有限;②逐个抽取;③等可能抽取. 进行抽样测试,先将50个零件进行编号,编号 2.简单随机抽样常用抽签法(适用于总体中个 分别为01,02,…,50,从中抽取5个样本,下面 体数较少的情况)、随机数法(适用于个体数较多的 提供随机数表的第1行到第2行: 情况). 第九章概率与统计 249 【对点训练1】用简单随机抽样的方法从含有10 A.抽取的中型商店比大型商店多4家 个个体的总体中抽取一个样本量为3的样本, B.样本容量为60 其中某一个体a“第一次被抽到”的可能性与 C.大、中、小型商店分别抽取4家、20家、36家 “第二次被抽到”的可能性分别是 D.被抽取的60家商店每日的零售额情况是所 抽取的一个样本 命题角度2分层随机抽样 考点2样本的数字特征 第 【例2】(1)(2023·新课标Ⅱ卷)某学校为了解学 命题角度1平均数、中位数、众数、方差、标准差、 九 生参加体育运动的情况,用比例分配的分层随 章 极差 机抽样方法作抽样调查,拟从初中部和高中部 【例3】(1)(多选题)(2021·新高考I卷)有一组 两层共抽取60名学生,已知该校初中部和高中 样本数据x1,x2,…,xn,由这组数据得到新样 部分别有400名和200名学生,则不同的抽样 结果共有 本数据y1y2,…,ym,其中y;=x,十c(i=1, 2,…,n),c为非零常数,则 () A.C48·C5种 B.C·C0种 A.两组样本数据的样本平均数相同 C.C9,·C0。种 D.C480·C2种 B.两组样本数据的样本中位数相同 (2)电影《孤注一掷》的上映引发了对电信诈骗 问题的热议,也加大了各个社区反电信诈骗的 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同 宣传力度.已知某社区共有居民480人,其中老 (2)(多选题)(2023·新课标I卷)有一组样本 年人200人,中年人200人,青少年80人,若按 年龄进行比例分配的分层随机抽样,共抽取36 数据x1x2,…,x6,其中x1是最小值,x6是最 大值,则 () 人作为代表,则中年人比青少年多抽取( A.6人 B.9人 A.x2x3x4x5的平均数等于x1x2,…,x6 C.12人 的平均数 D.18人 学生试答: B.x2x3,x4,x5的中位数等于x1,x2,…,x6 的中位数 C.x2,x3,x4,x5的标准差不小于x1x2,…, x6的标准差 D.x2,x3,x4,x5的极差不大于x1,x2,…,x6 的极差 幻学生试答: 规律总结 1.在比例分配的分层随机抽样中,抽样比 样本容量各层样本容量 总体容量一各层个体总量 2.在比例分配的分层随机抽样中,如果第一层 的样本量为m,平均值为x;第二层的样本量为n,平 均值为y,则样本的平均值为mx十 规律总结 m+n 用样本估计总体时,样本的平均数、标准差只 【对点训练2】(多选题)某市有大、中、小型商店 是总体的平均数、标准差的近似值.实际应用时,需 共1500家,且这三种类型的商店的数量之比 先计算样本数据的平均数,分析平均水平,再计算方 为1:5:9,现在要调查该市商店的每日零售额 差(标准差)分析稳定情况。 情况,用比例分配的分层随机抽样的方法从中 【对点训练3】(2021·全国乙卷)某厂研制了一 随机抽取60家商店,则下列选项正确的有 种生产高精产品的设备,为检验新设备生产产 品的某项指标有无提高,用一台旧设备和一台 250构·讲与练·高三数学·基础版 新设备各生产了10件产品,得到各件产品该项学生试答: 指标数据如下: 旧设备9.810.310.010.29.99.810.010.110.29.7 新设备10.110.410.110.010.110.310.610.510.410. 旧设备和新设备生产产品的该项指标的样本 第 平均数分别记为x和y,样本方差分别记为s 和s 章 (1)求x,y,s,s2; (2)判断新设备生产产品的该项指标的均值较 规律总结 计算一组n个数据的第力百分位数的步骤 旧设备是否有显著提高.(如果y一x≥ 从小到大排列原始数据 十,则认为新设备生产产品的该项指 2 第二步 计算i=nXp% 标的均值较旧设备有显著提高,否则不认为有 若不是整数,而大于的比邻整 数为j,则第p百分位数为第项数 显著提高》 据 第三步 若i是整数,则第p百分位数为第 项与第i+1项数据的平均数 【对点训练4】 组数据按从小到大的顺序排列 为2,4,m,12,16,17,若该组数据的中位数是 ·则该组数据的第40百分 考点3频率分布直方图 【例5】某校组织50名学生参加庆祝中华人民共 和国成立75周年知识竞赛,经统计,这50名学 生的成绩(单位:分)都在区间[50,100]内,按 分数分成5组:[50,60),[60,70),[70,80), [80,90),[90,100],得到如图所示的频率分布 直方图(不完整),根据图中数据,下列结论错 误的是 () 命题角度2百分位数 频率 ↑组距 【例4】通过抽样调查得到某栋居民楼24户居民 0.03 的月均用水量数据(单位:t),将其按从小到 0.02 大排序如下:2.1,3.2,3.2,4.3,4.3,5.5,6.7, 0.01 8.9,9.4,9.5,9.5,9.9,10.1,10.5,11.1,11.2, 12.5,14.8,15.2,15.3,18.4,19.0,20.8,22.4, 05060708090100成绩/分 则估计这24户居民的月均用水量的第25百分 A.成绩在[80,90)上的人数最多 位数为 B.成绩不低于70分的学生所占比例为70% A.4.3t B.5.5t C.50名学生成绩的平均数小于中位数 C.6.1t D.6.7t D.50名学生成绩的极差为50分 第九章概率与统计 251 学生试答: (3)已知落在[50,60)的平均成绩是56分,方 差是7,落在[60,70)的平均成绩为65分,方差 是4,求两组成绩的总平均数之和总方差2. 频率 组距 a 0.02 0.020 第 0.010 九 0.005 章 规律总结 0405060708090100成绩/分 1.在频率分布直方图中,每个小矩形的面积就 是相应的频率,所有小矩形的面积之和为1,这是解 题的关键,也是识图的基础 2.准确理解频率分布直方图的特点,频率分布 直方图中纵轴上的数据是各组的频率除以组距,不 要误以为纵轴上的数据是各组的频率,不要和条形 图混淆 3.频率分布直方图中的计算:其中众数取最高 的小矩形底边中点的横坐标;求中位数,可将频率分 布直方图划分为左、右两个面积相等的部分,分界线 与横轴交点的横坐标即是中位数(如先确定中位数 所在区间,利用“0.5一较低累积频率=(x一区间左 端点)X区间纵坐标”,求得的x便是). 【对点训练5】某市每年定期组织同学们进行禁 毒知识竞赛活动,为了解同学们对禁毒知识的 掌握情况,现从所有答卷中随机抽取100份作 为样本,将样本的成绩(满分100分,成绩均为 不低于40分的整数)分成六段:[40,50),[50, 60),…,[90,100],得到如图所示的频率分布 直方图 (1)求频率分布直方图中a的值; (2)求样本成绩的第75百分位数; 聚焦学科素养。数学应用背景下的“图表数据分析”问题 【题目呈现1】(多选题)(2024·辽宁大连二 医疗保健528元 ,其他用品及服务163元 模)如图为某市2024年第一季度全市居民人均消 交通通信583元 费支出构成图,已知城镇居民人均消费支出7924 居住2084元 教育文化娱乐791元 元,与上一年同比增长4.4%;农村居民人均消费 生活用品及服务356元 衣着453元 支出4388元,与上一年同比增长7.8%,则关于 食品烟酒1435元 2024年第一季度该市居民人均消费支出,下列说 A.2024年第一季度该市居民人均消费支出 法正确的是 ( 6393元 252红对构·讲与练·高三数学·基础版 B.居住及食品烟酒两项的人均消费支出总和 (%)50%=与上月比较无变化 54 超过了总人均消费支出的50% 53 52.6 C,城乡居民人均消费支出的差额与上一年同 52 51.9 50.1 50.1 比在缩小 50 的09.4 49 49.0 D.医疗保健与教育文化娱乐两项人均消费支 48 49.2 49.248.8 49.3 4 48.0 ¥47.0 出总和约占总人均消费支出的20.6% 46 九 学生试答: 022年891011122023年234567 7月月月月月月1月月月月月月月 有下列说法: ①从2022年7月到2023年7月这13个月的 PMI的极差为5.6%; ②PMI大于50%表示经济处于扩张活跃的 状态,PMI小于50%表示经济处于低迷萎缩的状 【题目呈现2】(多选题)(2024·湖南邵阳模 态,则2023年1月到2023年3月,经济处于扩张活 拟)有关数据显示,年轻一代的父母更加重视亲子 跃的状态; 陪伴,以往“以孩子为中心”的观念正逐步向与孩 ③从2023年1月到2023年7月这7个月的 子玩在一起、学在一起的方向转变.如图为2024年 PMI的第75百分位数为51.9%; 中国父母参与过的各类亲子活动人数在参与调查 ④2023年7月的PM为49.3%,比上月上升 总人数中的占比,根据该图,下列说法正确的是 0.3个百分点 ( 其中正确的有 () 角色扮演 A.1个 B.2个 C.3个 D.4个 亲子阅读 亲子合唱 学生试答: 子运动会 亲子种植 2 子游戏 亲子舞蹈 亲子烘培 亲子研学旅行 亲子演出 【题目呈现4】孩子在成长期间最需要父母 口占比 的关爱与陪伴,如图为2024年中国父母周末陪伴 A.在参与调查的总人数中父母参与过的亲子 孩子日均时长统计图,根据该图,下列说法错误 活动最多的是亲子阅读 的是 () B.在参与调查的总人数中同时参与过亲子阅 % 2024年中国父母周末陪伴孩子日均时长 读与亲子运动会的父母不少于20% 100 31.5 C.图中各类亲子活动占比的中位数为 80 38.7 40.14% 60 24.2 40 30.9 D.图中10类亲子活动占比的极差为57.70% 21.4 20 19.0 16.9 学生试答: 0 ■、01 8925 父亲 母亲 口1一2小时口2一4小时□4一6小时 ☐6一8小时 ■8小时以上 A.2024年母亲周末陪伴孩子日均时长超过8 小时修占花大日 B.2024年父亲周末陪伴孩子日均时长超过6 【题目呈现3】2023年7月31日国家统计局 发布了制造业采购经理指数(PMI),如图所示. 小时的占比大于号 第九章概率与统计 253 C.2024年母亲周末陪伴孩子日均时长的5个 A.2021一2024年该国星级酒店数量逐年 时段占比的极差为28.8% 减少 D.2024年父母周末陪伴孩子日均时长的10 B.2021一2024年该国星级酒店营业收人最高 个时段占比的中位数为20.2% 不超过2000亿元 学生试答: C.2021一2024年该国星级酒店餐饮收入比重 最高的是2022年 第 D.2021一2024年该国星级酒店餐饮收入比 重的极差是1.54% 章 学生试答: 【题目呈现5】如图为2021一-2024年某国星 级酒店数量、营业收入及餐饮收入比重,根据该 图,下列结论错误的是 ( ) 10000 .41.63% +42009% .41.13% 8423 41.00% 39.3% 40.009% 67 39.00% 38.19% 337 38.0% 1907.71 1221.53 379.4 1177.68 37.00% 》温馨提示 36.00% 2021 2022 2023 2024 学习至此,请完成训练66 ☐星级酒店营业收入亿元 门星级酒店数量/家 一餐饮收入比重/% 9.9 成对数据的统计分析 考试 1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单 要求 的实际问题。 回顾>必备知识 》知识梳理《 (2)当r>0时,称成对样本数据 ;当 1.变量的相关关系 r<0时,称成对样本数据 (1)相关关系:两个变量 ,但又没有确 (3)r≤1;当|r|越接近1时,成对样本数据 切到可由其中的一个去精确地决定另一个的程 的线性相关程度越 ;当|r|越接近0 度,这种关系称为相关关系. 时,成对样本数据的线性相关程度越 (2)正相关、负相关:从整体上看,当一个变量的值 3.一元线性回归模型 增加时,另一个变量的相应值也呈现 (1)我们将y=bx十a称为Y关于x的经验回 的趋势,就称这两个变量正相关;当一个变量的 值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关. 归方程,其中 (3)线性相关:一般地,如果两个变量的取值呈 x,-) =1 现正相关或负相关,而且散点落在 附 a =y-bx. 近,我们称这两个变量线性相关。 (2)残差:观测值减去 所得的差称为 2.样本相关系数 残差 ∑(x-x)(y,-y) 4.列联表与独立性检验 (1)r= (1)关于分类变量X和Y的抽样数据的2×2列 空-2-0 联表:

资源预览图

9.8 随机抽样、用样本估计整体-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
1
9.8 随机抽样、用样本估计整体-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
2
9.8 随机抽样、用样本估计整体-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
3
9.8 随机抽样、用样本估计整体-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
4
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。