内容正文:
10.3.1频率的稳定性
概念生成
一般地,在n次重复进行的试验中,事件A发生的频率为,当n很大时,总在某个常数附近摆动,随着n的增加,摆动幅度越来越小,这时就把这个常数叫做事件A的概率,记为P (A).
由定义可得概率P (A)满足:P (A)
事件的概率
典例分析
例1 新生婴儿性别比是每100名女婴对应的男婴数. 通过抽样调查得知,我国2014年、2015年新出生的婴儿性别比分别为115.88和113.51.
(1) 分别估计我国2014年和2015年男婴的出生率(新生儿中男婴的比率, 精确到0.001);
(2) 根据估计结果,你认为“生男孩和生女孩是等可能的”这个判断可靠吗?
(2)由于调查新生儿人数的样本非常大,根据频率的稳定性,上述对男婴出生率的估计具有较高的可信度.
因此,我们有理由怀疑“生男孩和生女孩是等可能的”的结论.
要得到生男孩和生女孩是否等可能的科学判断,还需要用统计学中假设检验的方法进行检验.
由此估计,2014年男婴出生率约为0.537,2015年男婴出生率约为0.532.
解:(1)2014年男婴出生频率为
0.537
2015年男婴出生频率为
0.532
典例分析
例2 一个游戏包含两个随机事件A和B,规定事件A发生则甲获胜,事件B发生则乙获胜. 判断游戏是否公平的标准是事件A和B发生的概率是否相等.
在游戏过程中甲发现:玩了10次时,双方各胜5次;但玩到1000次时,自己才胜300次,而乙却胜了700次.
据此,甲认为游戏不公平,但乙认为游戏是公平的.你更支持谁的结论?为什么?
解:当游戏玩了10次时,甲、乙获胜的频率都为0.5;
当游戏玩了1000次时,甲获胜的频率为0.3,乙获胜的频率为0.7.
根据频率的稳定性,随着试验次数的增加,频率偏离概率很大的可能性会越来越小.
相对10次游戏,1000次游戏时的频率接近概率的可能性更大,
因此我们更愿意相信1000次时的频率离概率更近.
而游戏玩到1000次时,甲、乙获胜的频率分别是0.3和0.7,存在很大差距,
所以有理由认为游戏是不公平的.
因此,应该支持甲对游戏公平性的判断.
新知探究
降水的概率是气象专家根据气象条件和经验,经分析推断得到的.对“降水的概率为90%”比较合理的解释是:大量观察发现,在类似的气象条件下,大约有90%的天数要下雨.
只有根据气象预报的长期记录,才能评价预报的准确性.如果在类似气象条件下预报要下雨的那些天(天数较多)里,大约有90%确实下雨了,那么应该认为预报是准确的;如果真实下雨的天数所占的比例与90%差别较大,那么就可以认为预报不太准确.
问题3 气象工作者有时用概率预报天气,如某气象台预报“明天的降水概率是90%,如果您明天要出门,最好携带雨具”,如果第二天没有下雨,我们或许会抱怨气象台预报得不准确.那么如何理解“降水率是90%”?又该如何评价预报得结果是否准确呢?
典例小结
由统计定义求概率的一般步骤
①确定随机事的频数nA(为试验的总次数);
②由计算频率;
③由频率估计概率.
10.3.2随机模拟
新知探究
问题1 用频率估计概率,需要做大量的重复试验. 有没有其他方法可以替代试验呢?
我们知道,利用计算器或计算机软件可以产生随机数. 实际上,我们也可以根据不同的随机试验构建相应的随机数模拟试验,这样就可以快速地进行大量重复试验了.
由试验产生的随机数:
例如我们要产生0~9之间的整数随机数,像彩票摇奖那样,把10个质地和大小相同的号码球放入摇奖器中,充分搅拌后摇出一个球,这个球上的号码称为随机数.
计算机产生的随机数:
利用计算机产生随机数是按照确定的算法产生的数,具有周期性,因此我们把利用计算机产生的随机数称为伪随机数.
典例分析
例1 从你所在班级任意选出6名同学,调查他们的出生月份,假设出生 在一月,二月,…,十二月是等可能的.设事件A =“至少有两人出生月份相同”,设计一种试验方法,模拟20次,估计事件A发生的概率.
模拟分析:根据题意,每个人的出生月份在12个月中是等可能的;而且相互之间没有影响,所以观察6个人的出生月份可以看成可重复试验.
解:(法一:用随机试验生成随机数进行模拟随机数法)
在袋子中装入编号为1,2,…,12的12个球,这些球除编号外没有什么差别,每个小球被摸到都是等可能的;
有放回地随机从袋中摸6次球,得到6个数代表6个人的出生月份,这就完成了一次模拟试验.
如果这6个数中至少有2个相同,表示事件A发生了.
重复以上模拟试验分别进行20次、40次、60次、100次...就可以统计出事件A发生的频率.
典例解析
例1 从你所在班级任意选出6名同学,调查他们的出生月份,假设出生 在一月,二月,…,十二月是等可能的.设事件A =“至少有两人出生月份相同”,设计一种试验方法,模拟20次,估计事件A发生的概率.
解:(法二:利用计算机电子表格软件模拟试验)
(1)利用计算机软件生成6个随机数,代表6个人的出生月份,则完成一次模拟试验;
(2)用计算机形成n组随机数组,即相当于做n次重复试验;
(3)统计其中有相同数的频率,得到事件A的概率的估计值.
典例解析
产生20组随机数组,相当于做了20次重复试验.
每列6个数字有重复数字出现就说明事件A发生,类似图中的红色区域。
我们可以看到事件A发生了14次,则事件A的频率值为0.7,与事件A的概率(约0.78)相差不大.
典例分析
例2 在一次奥运会男子羽毛球单打比赛中,运动员甲和乙进入了决赛.假设每局比赛甲获胜的概率为0.6,乙获胜的概率为0.4.利用计算机模拟试验,估计甲获得冠军的概率.
解:设事件A=“甲获得冠军”,事件B=“单局比赛甲胜”,P(B)=0.6.
用计算器或计算机产生1~5之间的随机数,当出现随机数1、2或3时,表示一局比赛甲获胜,其概率为0.6. 由于要比赛3局,所以每3个随机数为一组. 例如,产生20组随机数:
423 123 423 344 114 453 525 332 152 342
534 443 512 541 125 432 334 151 314 354
相当于做了20次重复试验.其中事件A发生了13次,对应的数组分别是 423,123,423,114,332,152,342,512,125,432,334,151,314,
用频率估计事件A的概率的近似为
典例小结
用随机模拟估计概率的方法
在使用整数随机数进行模拟试验时,首先要确定随机数的范围和用哪个代表试验结果.
(1)试验的基本结果是等可能的时,样本空间即为产生随机数的范围,每个随机数代表一个样本点.
(2)研究等可能事件的概率时,用按比例分配的方法确定表示各个结果的数字个数及总个数.
$$