第17讲 抽样方法与总体分布的估计-【艺考一本通】2026年高考数学一轮+二轮(通用版)

2025-12-11
| 2份
| 20页
| 59人阅读
| 9人下载
教辅
合肥亚泰嘉和文化传播有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 计数原理与概率统计
使用场景 高考复习-一轮复习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.21 MB
发布时间 2025-12-11
更新时间 2025-12-11
作者 合肥亚泰嘉和文化传播有限公司
品牌系列 艺考一本通·高考复习
审核时间 2025-09-15
下载链接 https://m.zxxk.com/soft/53894293.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

艺考一本通数学 第17讲 抽样方法与总体分布的估计 自主预习 知识梳理 夯实基础 1.抽样方法 适用范围:总体的个体数不多 从调查的对象中按照一定的方法抽取一部 优点:抽签法简便易行,当总体的个体数不太 分,进行调查或观测,获取数据,并以此对调 多时适宜采用抽签法。 查对象的某项指标做出推断,这就是抽样调 ②随机数表法:随机数表抽样“三步曲”:第一 查.调查对象的全体称为总体,被抽取的一部 步,将总体中的个体编号;第二步,选定开始 分称为样本. 的数字;第三步,获取样本号码: (1)简单的随机抽样 (2)分层随机抽样 简单随机抽样的概念 当已知总体由差异明显的几部分组成时,为 设一个总体的个体数为N.如果通过逐个抽 了使样本更充分地反映总体的情况,常将总 取的方法从中抽取一个样本,且每次抽取时 体分成几部分,然后按照各部分所占的比例 各个个体被抽到的概率相等,就称这样的抽 进行抽样,这种抽样叫做分层抽样,所分成的 样为简单随机抽样. 部分叫做层 ①用简单随机抽样从含有N个个体的总体 2.用样本估计总体 中抽取一个容量为n的样本时,每次抽取 (1)频率分布直方图 个个体时,任一个体被抽到的概率为:在整 结构一以横轴表示样本分组,纵轴表示频率与组距的此值 分 个抽样过程中各个个体被抽到的概率为; +数揭一落在各小组内的濒率用各小长方形的面积表示 直 特性各小长方形面积的和等于1 ②简单随机抽样的特点是:不放回抽样,逐个 地进行抽取,各个个体被抽到的概率相等; 可以利用频率分布直方图估计总体的取值 ③简单随机抽样方法体现了抽样的客观性与 规律。 公平性,是其他更复杂抽样方法的基础。 (2)百分位数与总体百分位数的估计 简单抽样常用方法 ①第p百分位数:一般地,一组数据的第p百 ①抽签法:先将总体中的所有个体(共有V 分位数是这样一个值,它使得这组数数据中 个)编号(号码可从1到N),并把号码写在形 至少有%的数据小于或等于这个值,且至 状、大小相同的号签上(号签可用小球、卡片、 少有(100一p)%的数据大于或等于这个值. 纸条等制作),然后将这些号签放在同一个箱 ②可以用样本数据的百分位数估计总体的百 子里,进行均匀搅拌,抽签时每次从中抽一个 分位数 号签,连续抽取n次,就得到一个容量为n的 (3)众数、中位数和平均数与总体集中趋势的 样本. 估计 ·100· 第一部分一轮单元复习第六单元 若x1…x为n个样本,则平均 验公式可直接利用换元,使新元与y具有线 平均数 数=比…+x 反映 性相关关系,进一步求出,对新元的线性回 数据 组从小到大排列的数,若个数 集中 是奇数位于中间的数为中位数: 归方程,换回x即可得y对x的回归曲线 趋势 中位数 若个数是偶数,中位数则是位于 的量 中间两数的平均数 方程 众数 一组数中出现次数最多的数据 (2)非线性回归问题有时并不给出经验公式, (4)总体集中趋势的估计 这时按以下步骤求回归方程: 极差 一组数据中的最大值与最小值的差 ①画出已知数据的散点图,看是否是线性回 反映 数据 方差 2=化-可+化-习++x-2 归分析问题,如果不是,把它与必修数学中学 离散 程度 过的函数(幂函数、指数函数、对数函数等)图 的量 标准差 (x1-)+(x2-)+…+(x-) n 像作比较,挑选一种跟这些散点拟合得最好 3.两变量间的相关关系与统计案例 的函数,采用适当的变量置换,把非线性回归 (1)从散点图上看,如果这些点从整体上看大 分析问题化为线性回归分析问题 致分布在通过散点图中心的一条直线附近, ②作相关性检验,即判断寻找线性回归方程 称两个变量之间具有线性相关关系,这条直 是否有意义, 线叫回归直线。 ③当寻找线性回归方程有意义时,计算系数 (2)从散点图上看,点分布在从左下角到右上 a,,得到线性回归方程. 角的区域内,两个变量的这种相关关系称为 ④代回x得y对x的回归曲线方程. 正相关,点分布在左上角到右下角的区域内, 5.独立性检验 两个变量的相关关系为负相关, (1)独立性检验 (3)回归方程为y=x十a,其中b 通过2×2列联表, 含- Y 合计 X b a+b ,a=y-bx a 含a好-n d c+d (4)相关系数 合计 a+c b+d n=a+b+c+d 2(x-x)(y一 再通过卡方统计量公式计算K2的值,利用 随机变量K来确定在多大程度上可以认为 “两个分类变量有关系”的方法称为两个分类 当>0时,表明两个变量正相关; 变量的独立性检验。 当<0时,表明两个变量负相关, (2)变量独立性的判断 r的绝对值越接近于1,表明两个变量的线性 通过对K?统计量分布的研究,已经得到两 相关性越强.r的绝对值越接近于0,表明两 个临界值:3.841和6.635。当数据量较大 个变量之间几乎不存在线性相关关系,通常 时,在统计中,用以下结果对变量的独立性进 r大于0.75时,认为两个变量有很强的线 行判断: 性相关性。 ①如果K≤3.841时,认为事件A与B是无 4.非线性回归分析 关的。 (1)对于非线性回归分析问题,如果给出了经 ②如果K2>3.841时,有95%的把握说事件 ·101· 艺考一本通数学 A与事件B有关; n(ad-bc)2 ③如果K>6.635时,有99%的把握说事件 (ate)(b+d(a+b)(c+d)' 计算出K A与事件B有关; 的值; (3)独立性检验的基本步骤及简单应用 ⑤统计推断:当K2>3.841时,有95%的把 要推断“A与B是否有关”,可按下面步骤 握说事件A与B有关; 当K2>6.635时,有99%的把握说事件A与 进行: ①提出统计假设H:事件A与B无关(相互 B有关; 独立); 当K>10.828时,有99.9%的把握说事件 ②抽取样本(样本容量不要太小,每个数据都 A与B有关: 要大于5); 当K≤3.841时,认为事件A与B是无 ③列出2×2列联表; 关的. ④根据2×2列联表,利用公式:K 典例剖析 典例变式 变式训练 题型一 简单随机抽样 【答案】①②③④ 【例1】下列抽取样本的方式不属于简单随机 【规律方法】抽签法与随机数法的适用情况 抽样的有 (1)抽签法适用于总体中个体数较少的情况,随 ①从无限多个个体中抽取100个个体作为 机数法适用于总体中个体数较多的情况! 样本 (2)一个抽样试验能否用抽签法,关键看两,点: ②盒子里共有80个零件,从中选出5个零 一是制签是否方便;二是号签是否易搅匀.一般 件进行质量检验.在抽样操作时,从中任意 地,当总体容量和样本容量都较小时可用抽 拿出一个零件进行质量检验后再把它放回 签法 盒子里, 变式训练一 ③从20件玩具中一次性抽取3件进行质量 1.某校高三(1)班共有48人,学号依次为1,2, 检验 3,…,48,现用系统抽样的办法抽取一个容量 ④某班有56名同学,指定个子最高的5名 为6的样本.已知学号为3,11,19,35,43的 同学参加学校组织的篮球赛, 同学在样本中,那么还有一个同学的学号应 【解析】①不是简单随机抽样.由于被抽取 为 () 的样本总体的个数是无限的,而不是有限 A.27 B.26 C.25 D.24 的。②不是简单随机抽样.由于它是放回抽 2.我国古代数学名著《数书九章》有“米谷粒分” 样.③不是简单随机抽样.因为这是“一次 题:粮仓开仓收粮,有人送来米1534石,验得米 性”抽取,而不是“逐个”抽取.④不是简单随 内夹谷,抽样取米一把,数得254粒内夹谷28 机抽样.因为指定个子最高的5名同学是 粒,则这批米内夹谷约为 () 56名中特指的,不存在随机性,不是等可能 A.134石 B.169石 抽样 C.338石 D.1365石 ·102· 第一部分一轮单元复习 第六单元 3.某年级有1000名学生,随机编号为0001, 解得x=16,y=12,m=42. 0002,…,1000,现用系统抽样方法,从中抽出 【答案】(1)18(2)42 200人,若0122号被抽到了,则下列编号也 【规律方法】分层抽样问题的解题策略 被抽到的是 ) (1)确定抽样比.可依据各层总数与样本数之 A.0116 B.0927 C.0834 D.0726 比,确定抽样比, 4.2015年11月11日的“双十一”又掀购物狂潮, (2)求某一层的样本数或总体个数.可依据题意 某网站对购物情况做了一项调查,收回的有效 求出抽样比,再由某层总体个数(或样本数)确 问卷共500000份,其中购买下列四种商品的 定该层的样本数(或总体数). 人数统计如下:服饰鞋帽198000人;家居用品 (3)求各层的样本数.可依据题意,求出各层的 94000人;化妆品116000人;家用电器92000 抽样比,再求出各层样本数 人.为了解消费者对商品的满意度,此网站用 变式训练二 分层抽样的方法从中选出部分问卷进行调查, 1.某班50名学生中有女生20名,按男女比例 已知在购买“化妆品”这一类中抽取了116人, 用分层抽样的方法,从全班学生中抽取部分 则在购买“家居用品”这一类中应抽取的问卷 学生进行调查,已知抽到的女生有4名,则本 份数为 ( 次调查抽取的人数是 () A.92 B.94 C.116 D.118 A.8 B.10 C.12 D.15 题型二分层抽样 2.某校共有高一、高二、高三学生1290人,其中 【例2】(1)某工厂生产甲、乙、丙、丁四种不同 高一480人,高二比高三多30人,为了解该校 型号的产品,产量分别为200,400,300,100 学生的身体健康情况,现采用分层抽样方法进 件.为检验产品的质量,现用分层抽样的方 行调查,在抽取的样本中有高一学生96人,则 法从以上所有的产品中抽取60件进行检 该样本中的高三学生人数为 () 验,则应从丙种型号的产品中抽取 A.84 B.78 C.81 D.96 件. 3.我国古代数学名著《九章算术》中有一抽样问 (2)一支田径队有男运动员56人,女运动员 m人,用分层抽样抽出一个容量为n的样 题:“今有北乡若干人,西乡七千四百八十八 本,在这个样本中随机取一个当队长的概率 人,南乡六千九百一十二人,凡三乡,发役三 百人,而北乡需遣一百零八人,问北乡人数几 为8且样本中的男队员比女队员多4人 何?”其意思为:“今某地北面有若干人,西面 则m 有7488人,南面有6912人,这三面要征调 【解析】(1)应从丙种型号的产品中抽取 300人,而北面共征调108人(用分层抽样的 300 60 200+400+300+100=18(件). 方法),则北面共有多少人?” () A.8000 B.8100 C.8200 D.8300 (2)由题意知n=28,设其中有男队员x人, 题型三样本估计总体 女队员有y人。 (一)频率分布直方图(高频考点) x+y=28, 则x一y=4, 频率分布直方图是高考的热点,选择题、填 56- 空题、解答题都有可能出现.难度一般较小, m y 高考对频率分布直方图的考查主要有以下 ·103· 艺考一本通数学 三个命题角度:①求样本的频率、频数;②求样 【答案】(1)10.15 210.015 (23 0 本的平均数、众数、中位数;③与概率结合考查 (3)204.56 某区间内的个体被选中的概率」 【规律方法】 【例3】(2025·上海卷)2024年东京奥运会, 中国获得了男子4×100米混合泳接力金 (1)频率、频数、样本容量的计算方法:①海率 组距 牌.以下是历届奥运会男子4×100米混合 泳接力项目冠军成绩记录(单位:秒),数据 组距=频车巴得装蔡亚=频率,四擎=样 按照升序排列: 本容量,④样本容量×频率=频数 (2)频率分布直方图与众数、中位数、平均数的 206.78207.46207.95209.34209.35 210.68213.73214.84216.93216.93 关系: (1)求这组数据的极差与中位数; ①最高的小长方形底边中点的横坐标为众数; (2)从这10个数据中任选3个,求恰有2个 ②中位数左边和右边的小长方形的面积和是相 数据在211以上的概率; 等的; (3)若比赛成绩y关于年份x的回归方程为 ③平均数是频率分布直方图的“重心”,等于频 y=-0.311x+b,年份x的平均数为2006, 率分布直方图中每个小长方形的面积乘以小长 预测2028年冠军队的成绩(精确到0.01 方形底边中点的横坐标之和」 秒). 【易错警示】①频率分布直方图的纵坐标是 【解析】(1)由题意,数据的最大值为 组距,而不是频率,切莫与条形图混淆.②制作 频 216.93,最小值为206.78,则极差为 好频率分布表后,可以利用各组的频率之和是 216.93一206.78=10.15;数据中间两数为209. 否为1来检验该表是否正确, 35与210.78,则中位数为209.35+210.68_ 变式训练三 1.某平台招聘外卖骑手,该平台提供了两种日 210.015.故极差为10.15,中位数为210.015: 工资方案:方案①,规定每日底薪为50元,骑 (2)由题意,数据共10个,211以上数据共 手每完成一单业务提成3元;方案②,规定每 有4个,故设事件A=“恰有2个数据在211 日底薪为100元,前44单业务没有提成,从 以上”,则P(A)三适=0,故恰有2个 第45单业务开始,骑手每完成一单业务提成 5元.该平台记录了每天骑手的人均业务量, 数搭在211以上的概率为品: 现随机抽取100天的数据,将样本数据分为 (3)由题意,成绩的平均数 [25,35),[35,45),[45,55),[55,65),[65, 20678+20.4+207.95+209.31+209.35+21068+21373+214.84+216.93+2169盟 75),[75,85),[85,95]七组,整理得到如图所 =211.399,由直线y=-0.311x+b过 示的频率分布直方图. (2006,211.399),则b=211.399+0.311× 十频率 组距 2006=835.265,故回归直线方程为y 0.030 -0.311x+835.265.当x=2028时,y 0.020 0.015 -0.311×2028+835.265=204.557≈204.56. 0.005 故预测2028年冠军队的成绩为204.56秒. 2535455565758595业务量/单 ·104· 第一部分 一轮单元复习第六单元 (1)随机选取一天,估计这一天该平台的骑手 满意度评 「50,60)「60,70)「70,80)「80,90) [90,100] 人均日业务量不少于65单的概率; 分分组 (2)若骑手甲、乙、丙选择了日工资方案①, 频数 2 8 14 10 6 丁、戊选择了日工资方案②,现从上述5名骑 (1)在图②中作出B地区用户满意度评分的 手中随机选取2名,求至少有1名骑手选择 频率分布直方图,并通过直方图比较两地区 日工资方案②的概率; 满意度评分的平均值及分散程度(不要求计 (3)若仅从人均日收入的角度考虑,请你利用 算出具体值,给出结论即可) 所学的统计学知识为新聘骑手做日工资方案 B地区用户满意度评分的频率分布直方图 频率 的选择,并说明理由.(同组中的每个数据用 组距↑ 该组区间的中点值代替) 0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0 50 60708090100满意度评分 (2)根据用户满意度评分,将用户的满意度分 为三个等级: 满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的 概率大?说明理由 2.某公司为了解用户对其产品的满意度,从A, B两地区分别随机调查了40个用户,根据用 户对产品的满意度评分,得到A地区用户满 意度评分的频率分布直方图和B地区用户 满意度评分的频数分布表, A地区用户满意度评分的频率分布直方图 频率 组距 0.040 0.035 0.030 0.025 0.020 88 0.005 0 405060708090100满意度评分 B地区用户满意度评分的频数分布表 ·105. 艺考一本通数学 3.2020年12月31日,国务院联防联控机制发 有确定2(C1十x6),c十x2十x3十x4的大小 布,国药集团中国生物的新冠病毒灭活疫苗 关系,所以无法判断,n的大小,例如:1, 已获药监局批准附条件上市,其保护效力达 2,3,4,5,6,可得m=n=3.5;例如1,1,1, 到世界卫生组织及药监局相关标准要求,现 1,1,7,可得m=1,n=2;例如1,2,2,2,2, 已对18至59岁的人提供.根据某地接种年 2,可得m=2,m是;故A错误:对于选项 龄样本的频率分布直方图(如图)估计该地接 种年龄的中位数为 B:不妨设x1≤x2≤x3≤x4≤x≤x6,可知 频率 x2,x3,x4,C5的中位数等于x1,x2,…,x6的 组距 0.040 中位数,均为工,故B正确;对于选项 0.034 2 0.030 88院 C:因为是最小值,x6是最大值,则2, 0.013 x3,x4,x5的波动性不大于x1,x2,…,x6的 波动性,即x2,x3,x4,的标准差不大于1, 01824303642485460年龄/岁 2,…,6的标准差,例如:2,4,6,8,10,12,则平 A.40 B.39 C.38 D.37 题型四 用样本的数字特征估计总体的数字 均教0一君(2+4+6十8+10+12)=7,标准差 特征 少 样本的数字特征是每年高考的重点,且多 √合[2-7y+(4-7)+(6-7+(8-7)+10-7)+12-7 与频率分布直方图、茎叶图相结合考查.主要命 105 题角度有:①数字特征的计算;②用样本的数字 3 ,对于数据4,6,8,10,则平均数m= 特征解决生活中的优化问题」 }(4十6+8十10)=7,标准差。 【例4】(2023·全国乙卷)(多选)有一组样本 数据,x2,…,x6,其中0是最小值,x6是 √[4-7)+(6-7)9+8-7P+10-7 最大值,则 ) A.x2,x3,x4,C5的平均数等于C1x2,…,6 -5,显然0西>5,即>故C错误; 的平均数 对于选项D:不妨设x1≤x2≤3≤x4≤x5≤ B.x2,x3,x4,x5的中位数等于x1,x2,…,x6 x6,则x6一x1≥x5一x2,当且仅当x1=x2, 的中位数 x=x6时,等号成立,故D正确;故选BD. C.x2,x3,x4,C5的标准差不小于x1,x2,…, 【答案】BD x6的标准差 【规律方法】样本数字特征及公式推广 D.x2,x3,c4,x的极差不大于1,x2,…,6 (1)平均数和方差都是重要的数字特征,是对总 的极差 体的一种简明的阐述.平均数、中位数、众数描 【解析】对于选项A:设x2,x3,x4,x的平均 述总体的集中趋势,方差和标准差描述波动 数为m,x1,x2,…,x6的平均数为n,则n 大小 m=234,5x6-2十x3十x4十 (2)平均数、方差公式的推广,若数据1, 6 _2(十x)-(x十十x十4),因为没 x2,…,xn的平均数为x,方差为s2,则数据mx1 12 十a,mx2十a,…,mxn十a的平均数为mx十a, ·106· 第一部分一轮单元复习第六单元 方差为ms2. 3.某城市100户居民的月平均用电量(单位: 变式训练四 度),以[160,180),[180,200),[200,220), 1.(2025·新课标Ⅱ卷)样本数据2,8,14,16, [220,240),[240,260),[260,280),[280, 20的平均数为 ( 300]分组的频率分布直方图如图. A.8 B.9 C.12 D.18 ,频率 十组距 2.(2023·全国乙卷)某厂为比较甲乙两种工艺 0.0125- 0.011 对橡胶产品伸缩率的处理效应,进行10次配 0.0095 对试验,每次配对试验选用材质相同的两个 0.005 橡胶产品,随机地选其中一个用甲工艺处理, 088 另一个用乙工艺处理,测量处理后的橡胶产 09 M6018020020240260280300月平均用电量/度 品的伸缩率.甲、乙两种工艺处理后的橡胶产 (1)求直方图中x的值; 品的伸缩率分别记为x,y(i=1,2,…,10) (2)求月平均用电量的众数和中位数, 试验结果如下: 试验序号12 3 4567 8910 伸缩率x545533551522575544541568596548 伸缩率536527543530560533522550576536 记:=x:一y(i=1,2,…,10),记1,2,…, 的样本平均数为之,样本方差为s2. (1)求z,s2; (2)判断甲工艺处理后的橡胶产品的伸缩率 较乙工艺处理后的橡胶产品的伸缩率是否有 显著提高(如果≥2 √0,则认为甲工艺处 52 理后的橡胶产品的伸缩率较乙工艺处理后的 题型五两变量间的相关关系与统计案例 橡胶产品的伸缩率有显著提高,否则不认为 (一)回归分析 有显著提高) 【例6-1】(1)x和y的散点图如图所示,则下 列说法中所有正确的序号为 ↑y 300 2500 2000 1500 1000 500 01 345678910x ①x,y是负相关关系; ②在该相关关系中,若用y=c1er拟合时的 相关系数的平方为r,用y=x+a拟合时 的相关系数的平方为r号,则>; ·107· 艺考一本通数学 ③x、y之间不能建立线性回归方程, A.我国2010一2018年未成年人犯罪比重持 (2)(2024·天津卷)下列图中,相关性系数 续下降 最大的是 ( B.与2010年相比,2019年未成年人犯罪比 。 重下降4.19个百分点 C.2019年我国未成年人犯罪的人数多于 ●● 2018年 B D.2010一2019年我国未成年人犯罪人数所 占比重的中位数为3.91% 2.(2023·全国甲卷)一项试验旨在研究臭氧效 应,试验方案如下:选40只小白鼠,随机地将 D 其中20只分配到试验组,另外20只分配到 【解析】(1)①显然正确;由散,点图知,用y 对照组,试验组的小白鼠饲养在高浓度臭氧 =c1er拟合的效果比用y=bx十a拟合的 环境,对照组的小白鼠饲养在正常环境,一段 效果要好,故②正确;x,y之间能建立线性 时间后统计每只小白鼠体重的增加量(单位: 回归方程,只不过预报精度不高,故③不正 g).试验结果如下: 确.故答案为①②, 对照组的小白鼠体重的增加量从小到大排 (2)观察4幅图可知,A图散,点分布比较集 序为 中,且大体接近某一条直线,线性回归模型 15.218.820.221.322.523.2 拟合效果比较好,呈现明显的正相关,值 25.826.527.530.132.634.3 相比于其他3图更接近1.故选A. 34.835.635.635.836.237.3 【答案】(1)①②(2)CD 40.543.2 【规律方法】最小二乘估计的三个步骤 试验组的小白鼠体重的增加量从小到大排 (1)作出散点图,判断是否线性相关. 序为 (2)如果是,则用公式求a,b,写出回归方程. 7.89.211.412.413.215.516.5 (3)根据方程进行估计. 18.018.819.219.820.221.6 【注意】回归直线方程恒过,点(x,y) 22.823.623.925.128.232.3 变式训练五(一) 36.5 1.国家统计局2021年1月的统计数据显示,我 (1)计算试验组的样本平均数; 国2010一2019年未成年人犯罪人数所占比 (2)(ⅰ)求40只小白鼠体重的增加量的中位 重如图所示,则下列说法不一定正确的是 数m,再分别统计两样本中小于m与不小于 ( m的数据的个数,完成如下列联表 2010-2019年未成年人犯罪人数所占比重 10 <m ≥m 6.786.40 5.44 对照组 824.263.56293 2582.412,59 试验组 2010201120122013201420152016201720182019年份 (iⅱ)根据(i)中的列联表,能否有95%的把握 ·108· 第一部分一轮单元复习第六单元 认为小白鼠在高浓度臭氧环境中与在正常环 销费用多少万元.(结果精确到0.01) 境中体重的增加量有差异? 参考数据: 附:K2 n(ad-bc)2 2(-1(-3》=4. (a+b)(c+d)(a+c)(b+d)' 2a-11y=340 ∑(y-3)2=16.5, P(K≥k) 0.1000.0500.010 √340≈18.44,√16.5=4.06,其中x:,y:分别 2.7063.8416.635 为第i个月的促销费用和产品销量,i=1,2, 3,…,8. 参考公式:(i)样本(c,以)(i=1,2,…,n)的相 2(5-0(y- 关系数r x-- (i)对于一组数据(01,y),(x2,y2),…, (In,yn), 其回归方程方 空x-3- -,a =y-bx. - 3.随着网络的发展,网上购物越来越受到人们 的喜爱,各大购物网站为增加收入,促销策略 越来越多样化,促销费用也不断增加,下表是 某购物网站2017年1一8月促销费用x(万 元)和产品销量y(万件)的具体数据 月份 2 3 4 5 6 7 8 促销费用x 2 3 61013 21 15 18 产品销量y 11 233.5 5 4 4.5 (1)根据数据绘制的散点图能够看出可用线 性回归模型拟合y与x的关系,请用相关系 数r加以说明;(系数精确到0.001) (2)建立y关于x的回归方程y=bx+a(系 数精确到0.01),如果该公司计划在9月份 实现产品销量超6万件,预测至少需投入促 ·109·1 PAB=4-日,故ABD正确,C错误,故选ABD P(A3)1 4 7.A【解析】已知2位女同学和2位男同学走出的所有可能 顺序有(女,女,男,男),(女,男,女,男),(女,男,男,女), (男,男,女,女),(男,女,男,女),(男,女,女,男),所以第2 位走出的走男同学的概率P=号-合故选A &.ABD【解析]时于A,由题意可得PA=兰=合,P(B)= 4 是=,PCAB)=子,所以PAB)=PAP(B,故A正 疏对于BPC=号-7PA0=PaG=智 =PC=梁=号,所以PA1O=PCA,故 B正瑞;对于C,因为PABC)=,P(A)P(BP(CO)=× 合X号-=日所以PABC)≠PAPPO,故C精 对于D,因为PBO)=},所以P(BC)=P(B)P(C.故D 正确.故选ABD. 9.BC【解析】若正确选项的个数为2个,则有(1,2),(1,3), (1,4),(2,3),(2,4),(3,4)共6种组合,每种组合为正确答 案的概率为了×日=西若正璃选项的个数为3个,则有 (1,2,3),(1,2,4),(1,3,4),(2,3,4)共4种组合,每种组合 为正确答案的概率为了×=立:若正骑选项的个数为4 个,则有(1,2,3,4)共1种组合,这种组合为正确答案的概率 为行随便选了三个选项,能完全答对这道题的概率为2 A错误:1选项是正确选项的概率为3X品十3X位十 1 日-子>?B正确:1选项为正喷递项为率件A,由B选 项知,P(A=子,正确选项有3个为事件B,则P(BA) 空-占,C至1或项为件溪线项为半外C 1 P(AB) P(A) 3 4 P(O=子,正确选项有2个为事件D,则P(DC)=PC咒 P(C) 3X8=名,D错误. 三 1 3 4 10.需【解析】诺第一轮在第一轮中得1分,若第一轮中甲抽 到的小球为1,3,则乙抽到的小球只能是2,若第一轮中甲 抽到的小球为1,4,则乙抽到的小球可以是2或3,若第一 轮中甲抽到的小球为2,3,则乙抽到的小球可以是1或4, 若第一轮中甲抽到的小球为1,5或者2,4或者2,5或者3, 4或者3,5或者4,5时,则乙抽到的小球可以是剩下三个 小球中的任何一个,故共有6×3=18,因此第一轮中甲得1 分的概率为1十18-器在第二轮的过程中,只剩下 CC 两个球,要使甲在第二轮中得1分,只需要甲在剩下两个球 中抽到号码大的球即可,故概率为2,因此甲在两轮中共 参考答案·数学 得2分的概率为7×铝-器故答案为器 第17讲抽样方法与总体分布的估计 【典例变式】 变式训练一 1.A【解析】根据系统抽样的规则—“等距离”抽取,也就 抽取的号码差相等,根据抽出的序号可知学号之间的差为 8,所以在19与35之间还有27. 2B【解析】由题意,这批来内夹谷约为1534×器≈ 169(石). 3.B【解析】样本间隔为1000÷200=5,因为122÷5=24余 2,故抽取的余数应该是2的号码,116÷5=23余1,927÷ 5=185余2,834÷5=166余4,726÷5=145余1. 4.B【解析】在购买“化妆品”这一类中抽取了116人,则在购 买“家居月品”这一美中应袖取的问卷份教为,则6 =94000,解得x=94. 变式训练二 1.B【解析】因为50名学生中有女生20名,按男女比例用分 层抽样的方法,抽到的女生有4名,所以本次调查抽取的人 数是50×易=10,故选B 2.B【解析】设高三人数为x,由480+(30十x)十x=1290 可得x=390,分层抽样为按比例抽样则样本中的高三学生 人数为8×96=78故选B 3.B【解析】设北面人数为x,根据分层抽样,可得 干748+9205解得=810人.故选R 变式训练三 1.【解析】(1)由图知,该平台的骑手人均日业务量不少于65单 的频率为0.2十0.15十0.05=0.4,所以随机选取一天,估计 这一天该平台的骑手人均日业务量不少于65单的概率 为0.4. (2)因为从5名骑手中随机选取2名的基本事件总数=C =10,至少有1名骑手选择日工资方案②的基本事件个数m 二CC+C=7所以所求报奉P-只-品 (3)由图知,该平台的骑手人均日业务量的平均数是30× 0.05+40×0.05+50×0.2+60×0.3+70×0.2+80×0.15 +90×0.05=62(单),所以方案①的日工资约为50+62×3 =236(元),方案②的日工资约为100+(62一44)×5=190 (元),故新聘骑手应选择方案①. 2.【解析】(1)如图所示. B地区用户满意度评分的频率分布直方图 频率 组距↑ 0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0 5060708090100满意度评分 通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A地区用户满意度评分 的平均值:B地区用户满意度评分比较集中,而A地区用户 满意度评分比较分散. (2)A地区用户的满意度等级为不满意的概率大.记C表示 27 艺考一本通数学 事件:“A地区用户的满意度等级为不满意”:CB表示:“B地 区用户的满意度等级为不满意”.由直方图得P(C)的估计 值为(0.01十0.02+0.03)×10=0.6,P(C)的估计值为(0. 005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大. 3.C【解析】年龄位于[18,24)的频率为0.013×6=0.078,年 龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30, 36)的频率为0.034X6=0.204,年龄位于[36,42)的频率为 0.040×6=0.240,因为0.078+0.138+0.204=0.420.5, 而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以 中位数位于[36,42),设中位数为x,则0.078十0.138+0. 204十(x一36)×0.04=0.5,解得x=38.故选C. 变式训练四 1.C【解析】样本数据2.8,14.16,20的平均数为 2+8+14+16+2060=60=12.故选C. 5 2.【解析】 (1)元=545+533+551+522+575+54+541+568+596+548 10 =552.3, y=536+527+543+530+560+533+522+550+576+536 10 =541.3, 2=x-y=552.3-541.3=11, ≈=x-y的值分别为:9,6,8,-8,15,11,19,18,20,12, 故2= 9-11+(6-11)+8-11十长-8-11十女15-11+0+19-11十(18-11+20-11y+12-11 0 =61 2 (2)(1)知:=11,2√6=26=/24,4,故有≥ 2N10' 所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理 后的橡胶产品的伸缩率有显著提高 3.【解析】(1)由(0.002+0.0095+0.011+0.0125+x+0.005 +0.0025)×20=1得x=0.0075, 所以直方图中x的值为0.0075. (2)月平均用电量的众数是220240=230. 2 因为(0.002+0.0095+0.011)×20=0.45<0.5, (0.002+0.0095+0.011+0.0125)×20=0.7>0.5,所以 月平均用电量的中位数在[220,240)内,设中位数为a,则 (0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5, 解得a=224,即中位数为224. 变式训练五(一) 1.C【解析】我国2010~2018年未成年人犯罪比重持续下 降,故A选项正确:与2010年相比,2019年未成年人犯罪比 重下降为6.78一2.59=4.19个百分点,故B选项正确;由于 所有犯罪的人数未知,虽然2019年未成年人犯罪人数所占 比重大于2018年,但无法确定2019年我国未成年人犯罪的 人数是否多于2018年,故C选项不一定正确:2010~2019 年,犯罪人数所占比重从小到大依次为2.41%,2.58%, 2.59%,2.93%,3.56%,4.26%,4.82%,5.44%,6.40%, 6.78%,由中位数的定义可知,我国未成年人犯罪人数所占 比重的中位教为3.56%)426必=3.91%,故D选项正确。 2 故选C. 2.【解析】(1)试验组样本平均数为: 20(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+ 18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+ 28 25.1+28.2+32.3+36.5)=20=10.8 (2)()依题意,可知这40只小鼠体重的中位数是将两组数 据合在一起,从小到大排后第20位与第21位数据的平均 数,故第20位数据为23.2,第21位数据为23.6,所以m= 23.2+23.6 2 =23.4,故列联表为: m 2≥1 合计 对照组 6 14 20 试验组 14 6 20 合计 20 20 40 (i)由(i)可得,K= 40×(6×6-14×14)2 =6.400>3.841, 20×20×20×20 所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在 正常环境中体重的增加量有差异. 3.【解析】(1)由题意可知x=11,y=3,将数据代入r= 之(x-五)0一 74.5 二, 得r≈18.44X4.06 (x-x)2 74.5 74.8664≈0.995. 因为y与x的相关系数近似为0.995,说明y与x的线性相关 性很强,从而可以用线性回归模型拟合y与x的关系.(需要 突出“很强”,若有“一般”或“较弱”字样不给分) 2》将教据代入=之Ga2(y-》 2,得6=74.5=0.219, 2(x-x)2 340 a=y-x=3-0.219×11≈0.59,所以y关于x的回归方 程为y=0.22x+0.59.由y=0.22x+0.59>6,解得x 24.59,即至少需要投入促销费用24.59万元, 4【解析】(1)依题意,元=1+2+3+4十5=3,= 0.4+07+1+1.4+1.5=1,∑(m-D(y-)=2.9, 5 ∑(-)2=4+1+1+4=10,6= ∑(x,-x(y- ∑(x- =0.29,故a=y-bx=1-0.29×3=0.13,故所求线性回 归方程为y=0.29x十0.13. (2)依题意,新车花费: 5年花费 3,5) 5,7) [7,9) [9,11)[11,13)[13,15 /万元 人数 60 100120 40 60 20 频率 0.150.250.30.1 0.150.05 依题意,x=4×0.15+6×0.25+8×0.3+10×0.1+12× 0.15+14×0.05=8,s2=0.15×(-4)2+0.25×(-2)2十 0.1×22+0.15×42+0.05×62=8. 5.(1)散点图见解析,y=mex+:(2)y=10×e-x十0.8 【解析】(1)散点图如图, /微克 2 012345x/次数 用y=mex十n作为清洗x次后1千克该蔬菜残留的农药 量的回归方程类型 ∑(w:-)(y- (2)由题知m= 0.9=10,n=y-m 0.09 ∑(w:-) w=2-10×0.12=0.8,故所求的回归方程为y=10×ex+ 0.8. 变式训练五(二)】 1.A【解析】根据独立性检验的定义,由K≈7.8>6.635可 知,我们有99%以上的把握认为“爱好该项运动与性别有 关”.故选A 2.【解析】(1)依题意,2×2列联表如下: 视频从业人员 Sora的应用情况 合计 减少 未减少 应用 54 18 72 没有应用 36 42 78 合计 90 60 150 零假设H。为:Sora的应用与视频从业人员的减少独立, Sora的应用前后视频从业人员无差异,由列联表中数据得, X=150X528×36L-6≈12.981>10.828.根 72×78×90×60 52 据小概率值a=0.001的X的独立性检验,推断H不成立, 所以有99.9%的把握认为Sora的应用与视频从业人员的减 少有关; (2)(i)设A:=“员工第i轮获得优秀”(i=1,2,3),且A,相互 独立.设B=“员工经过培训能应用Sora”,则P(B)=P A,AA)+P不AA)+PA石A)+PAA不)=号 ××号+号×号×+号×号×号+号××号 号,故员工经过培训能应用S0a的概率是号 (i)设视频部调x人至其他部门,x∈N,X为培训后视频部 能应月用S0a的人数,则X~B(100-,号),因此E(X) 10,工,调整后视频部的年利润为10,工×10十 2 2 (1-号)100-x)×6-(100-x)=(700-7)(万元),令 700-7x≥100×6,解得≤109≈14.3,又x∈N,所以xm 7 =14.因此,视频部最多可以调14人到其他部门. 【基础训练】 1.C【解析】因为该地区经过一年的新农村建设,农村的经济 收入增加了一倍,不妨设建设前的经济收入为,则建设后 的经济收入为2,A选项,从扇形统计图中可以看到,新农 村建设后,种植收入比建设前增加2m×37%一m×60%=m ×14%,故A正确;B选项,新农村建设后,其他收入比建设 前增加2mX5%一mX4%=mX6%>mX4%,即增加了 倍以上,故B正确:C选项,养殖收入的比重在新农村建设前 与建设后相同,但建设后总收入为之前的2倍,所以建设后 的养殖收入也是建设前的2倍,故C错误;D选项,新农村建 设后,种植收入在经济收入中所占比重由建设前的60%降 为37%,故D正确.故选C. 2.C【解析】数据,,…,x10,2的平均值为2,方差为1, 故7[(m-2)2+(m-2)2+…+(x0-2)2+(2-2)2]= 1,数据1,2,…,xn的方差2=0[(m一2)2+(2-2)2+ …十(x1一2)]>1,故相对于原数据变得比较不稳定,选C. 参老答案·数学 3.B【解析】先将每个年级的人数凑整,得高一:1800人,高 二:1600人,高三:1500人,则三个年级的人数占总人数的比 181615 创分别为,的丽因此,各年级抽取人数分别为98X9 =36,98×8=32,98×38=30,故选B 4.C【解析】由题意,0.06×5+x×0.1=0.5,所以x为2,所 以由图可估计样本重量的中位数是12,故选C. 5.C【解析】由题意得,(0.004+a十0.022+0.028+0.022+ 0.018)×10=1,解得a=0.006.对于选项A,成绩在[40, 70)内的频率为(0.004十0.006十0.022)×10=0.32,成绩在 40,80)内的频率为(0.004+0.006+0.022+0.028)×10= 0.6,故中位数在[70,80)间,但样本成绩在[70,80)间的可能 均为74分,故中位数不一定大于75,所以选项A错误;对于 选项B,由极差的定义知,学生成绩的极差介于40至60之 间,所以选项B错误:对于选项C,由平均数的定义知,学生 成绩的平均成绩为(45×0.004+55×0.006+65×0.022+ 75×0.028+85×0.022+95×0.018)×10=76.2,介于70 至80之间,所以选项C正确;对于选项D,由于成绩不低于 60分的频率为0.18十0.22×2+0.28=0.9,所以成绩不低 于60分的人数是1500×0.9=1350,所以选项D错误.故 选C 6.B【解析】由表格中数据可得,x=4,y=50,所以50=4× 10.2十a,解得a=9.2,所以回归方程为y=10.2x+9.2,所 以当x=10时,y=10.2×10十9.2=111.2,即预测广告费为 10万元时销售额约为111.2万元,故选B. 7.D【解析】由图可知,收入最高值为90万元,收入最低值 为30万元,其比是3:1,故A正确:由图可知,结余最高为7 月份,为80一20=60,故B正确;由图可知,1至2月份的收 入的变化率与4至5月份的收入的变化率相同,故C正确; 由图可知,前6个月的平均收入为日(40+60十30+30十 50+60)=45万元,故D错误,故选D. 8C【解析】因为=(i十+对十-16)= 1 [(x1-元)2+(x2-元)2+(x3-元)2+(x4-x)2],所以27(x1 +x2+x3+x4)一4z2=16,所以872一42=16,7=2,即x1 +x十0十4=8,所以+2+十2+西+2+4十2=4, 4 故选C 9.AB【解析】由题得10×(0.005十x十0.035+0.030+0. 010)=1,解得x=0.020,故A正确:在频率分布直方图中, 前三个小长方形的面积和为0.6,前四个小长方形的面积和 为0.9,所以这组数据的第80百分位数约为80十号×10≈ 86.67,故B正确:这组数据的平均数的估计值为10×(55× 0.005+65×0.020+75×0.035+85×0.030+95×0.010) =77,故C不正确:由频率分布直方图可知,得分在[50,70) 内的频率为0.005×10+0.020×10=0.250.50,得分在 [50,80)内的频率为0.005×10+0.020×10+0.035×10= 0.60>0.50,则中位数在[70,80)内,所以这组数据的中位数 的估计值为70十0,5025×10≈7.14,故D不正确.故 0.35 选AB. 10.144【解析】由题意得,这批产品的此项质量指标的平均 数为20×0.1+40×0.6+60×0.3=44,故方差为 (20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3 =144. 11.(1)认为是否喜欢网上买菜与年龄有关系,此推断犯错误的 概率不大于Q05(2)号(3)X的数学期望E(X)=6,方 差DX)-号,Y的数学期望E)=15,方差D)=9 5 29 艺考一本通数学 【解析】(1)统计假设H:该社区的居民是否喜欢网上买菜 与年龄无关系,由给定的2×2列联表,得X 100×(40×30-10×20)=100>3.841.根据小概率值a 50×50×60×40 6 =0.05的独立性检验,否定假设H,,即认为是否喜欢网上 买菜与年龄有关系,此推断犯错误的概率不大于0.05: (2)设A表示周i在A平台买菜,B:表示周i在B平台买 菜,i=1.2.由题可得P(A)=P(B)=号,P(BA) 号,P(B:B)=号.由全概率公式,小张周二选择在B平 台买菜的概率P(B2)=P(A1)P(B2A1)+P(B1)P(B2| B)=×号十日×号-易:(3)猴题意,社区居民喜 欢网上买莱的概率估计位为需=是从滨社区随机物取 10名居民,其中喜欢网上买菜的居民人数XB(10,号), 所以X的教学期望E(X)=10X号=6,方差DX)=10X 号×(1-是)=号.又Y=2X+3,所以Y的数学期塑E 5 (Y)=2EX)+3=15,方差D(Y)=4DX)=s 12.1)答案见解析(2)卫,=号+号(-号)(3)最大值为 子最小值为分 【解析】(1)由折线图中数据和附注中参考数据得i=4, 2a--8/y-=a2.4-0 -)=∑y-1∑y=68.35-4×16.17=3.67,所以 3.67 相关系数r=0.72X2X2.646≈0.9632,因为y与1的相关 系数近似为0.9632,说明y与t的相关程度相当高,从而可 以用线性回归模型拟合》与y的关系. (2)依题意得,P.=3P1+号P-(≥3),其中P=3, P,=3×g+号-名,则卫-卫1=-号(P1-P) (n≥3),所以P。-P,}是以首项为P,-P,=号,公比为 号的等比数列,故P.-P1=号(-号)(n≥2)成 立,则有P.-P1十P-2-P+…+P-P=号 [(-号)°+(号)+(号)++(-号)]= X二盖C》所以=A+ -告(号),又P=子,则R.=子+告-吉 ()=是+(号 《③)当u为偶教时,P,=号十号(号)”,单洞递减,最大值 为P=弓十,P.号当n为奇数时,P.=昌一号 (号)广,单调递增,最小值为卫=号十o©,P,→号,所 以数列P,的最大值为号,最小值为子 30 第18讲排列组合、二项式定理 【典例变式】 变式训练一 1.B【解析】发言的3人来自3家不同企业且含甲企业的人 的情况有CC=20(种):发言的3人来自3家不同企业且 不含甲企业的人的情况有C=10(种).所以发言的3人来 自3家不同企业的可能情况共有20+10=30(种),故选B. 2.A【解析】若α2=2,则百位数字只能选1,个位数字可选1 或0.“凸数”为120与121,共2个.若a2=3,则“凸数”有2× 3=6(个).若2=4,满足条件的“凸数”有3×4=12(个), …,若a2=9,满足条件的“凸数”有8X9=72(个).所以所有 凸数有2+6+12+20+30+42+56+72=240(个). 变式训练二 1.C【解析】将4个1和2个0随机排成一行,可利用插空法, 4个1产生5个空,若2个0相邻,则有C种排法:若2个0 不相邻,则有C号=10种排法,所以2个0不相邻的概率为 102 5+10-3.故选C 2.D【解析】初中部和高中部总共有400+200=600(人),按 照分层抽料的原星,应从初中亦抽取器×60=40(人),从 高中部抽取器×60=40(人),第一步:从初中部抽取40人, 有C8种方法,第2步:从高中部抽取20人,有C8种方法, 根据分步计数原理,一共有C·C鄂种方法;故选D. 3.24112【解析】由题意知,选4个方格,每行和每列均恰有 一个方格被选中,则第一列有4个方格可选,第二列有3个 方格可选,第三列有2个方格可选,第四列有1个方格可选, 所以共有4X3X2×1=24种选法;每种选法可标记为(a,b, c,d),a,b,c,d分别表示第一、二、三、四列的数字,则所有的 可能结果为:(11,22,33,44),(11,22,34,43),(11,22,33, 44),(11,22,34,42),(11,24,33,43),(11,24,33,42),(12, 21,33,44),(12,21,34,43),(12,2231,44),(12,22,34,40), (12,24,31,43),(12,24,33,40),(13,21,33,44),(13,21, 34,42),(13,22,31,44),(13,22,34,40),(13,24,31,42), (13,24,33,40),(15,21,33,43),(15,21,33,42),(15,22, 31,43),(15,22,33,40),(15,22,31,42),(15,22,33,40),所 以选中的方格中,(15,21,33,43)的4个数之和最大,为15 +21+33+43=112.故答案为24:112. 变式训练三 1.80【解析】由通项公式T+1=Cg·2-r·x-·(一1)= Cg·(-1)”·2-r2x-,令5-r=3,得r=2,可得x3项的 系数为Cg·(-1)2·2-2=80.故答案为80. 2.A【解析(2-x)的展开式的通项公式为T,+1=C·2- ·(一1)”·x,则1X(2一x)4的展开式中含有x的项为C ·21·(-1)3·x3=-8x3,a.x2×(2-x)4的展开式中含有 x3的项为a.x2×C·23·(-1)1·x=-32ax3,则-8 32a=8,解得a=合故选A 3.C【解析】令x=1,可得a十1=2,所以a=1,所以 (ax+7)(2x-1)=(x+之)(2x-1)5,则展开式中常数项 为(2x一1)5展开式中x项的系数,即2C(一1)4=10.故 选C 4.12【解答近-二)的二项展开式的中,只有第5项的 二项式系数最大,所以n=8,通项公式为T,+1=C·(一2) ·→=(-2C心·中,令8=0,求得r=2,可符 二项展开式中常数项等于4×C%=112. 5.C【解桥】(x2+二-2)表示5个因式(x2+-2)的乘

资源预览图

第17讲 抽样方法与总体分布的估计-【艺考一本通】2026年高考数学一轮+二轮(通用版)
1
第17讲 抽样方法与总体分布的估计-【艺考一本通】2026年高考数学一轮+二轮(通用版)
2
第17讲 抽样方法与总体分布的估计-【艺考一本通】2026年高考数学一轮+二轮(通用版)
3
第17讲 抽样方法与总体分布的估计-【艺考一本通】2026年高考数学一轮+二轮(通用版)
4
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。