内容正文:
第四章 线的关系
第六节 最佳拟合直线
(FitLine)
基本概念:最佳拟合直线是统计学中用于描述两个变量之间线性关系的直线,当我们有一组数据点(比如x和y两个变量的多组对应值),这些点在坐标系中可能分散分布,而最佳拟合直线就是能“最接近”所有这些点的一条直线。它的核心作用是:用一条直线来近似表示数据点的整体趋势,使得各个数据点到这条直线的距离(通常是垂直距离)的平方和最小,这种方法也被称为“最小二乘法”。
1. 工具构造:绘图区已构造ABCDE五个点如(图1),在“线的关系”工具箱中选择“最佳拟合直线”工具—工具提示—右键框选—构建最佳拟合直线如(图2)。
图1 图2
2. 指令构造:语句中文:拟合直线Y(<点列>),英文:FitLine(<ListofPoints>);
拟合直线Y({A,B,C,D,E}),也可以构造拟合直线f。
示例1:假设已知一组离散数据点:(1,2)、(2,4)、(3,5)、(4,7)、(5,8),需要找到一条直线y=kx+b来近似描述这些点的趋势。
(1) 构造点列l1={(1,2),(2,4),(3,5),(4,7),(5,8)}如(图3)。
图3 图4
(2) 拟合直线Y(l1),生成如(图4)。
通过最小二乘法计算(使各点到直线的纵向距离平方和最小),可得拟合直线为y=1.4x+0.6。这条直线能较好地反映数据整体的线性增长趋势,尽管个别点如(2,4)不完全在直线上,但整体误差最小。
示例2:在“探究小车速度随时间变化的规律”实验中,通过打点计时器得到小车在不同时刻的速度数据如表格:
时间t/s
1
2
3
4
5
速度v/m.s-1
2.1
4.0
5.9
8.0
9.9
(1) 构造点列:l1={(1,2.1),(2,4.0),(3,5.9),(4,8.0),(5,9.9)};
(2) 工具和指令构造“拟合直线”,得拟合直线f和直线方程,如(图5);
图5
替换x—t;y—v得速度—时间方程:v=1.96t+0.1,近似为v=2t,说明小车做匀加速直线运动,初速度v0=0.1m/s。最佳拟合直线X和最佳拟合直线Y的区别
1. 拟合方向不同
最佳拟合直线Y
假设X是自变量,Y是因变量,拟合直线的目的是用X预测Y。计算时,使各数据点到直线的纵向距离(Y方向)的平方和最小(最小二乘法中常用的“垂直于X轴的误差”)。
直线方程通常表示为 y= a + bx。
最佳拟合直线X
假设Y是自变量,X是因变量,拟合直线的目的是用Y预测X。
计算时,使各数据点到直线的横向距离(X方向)的平方和最小(“垂直于Y轴的误差”)。
直线方程通常表示为x= c + dy 。图(5)为离散很大的点ABCDE两种拟合的直线。
2.最佳拟合直线Y和最佳拟合直线X得到的直线方程不是反函数的关系
练习与思考
(1)某地区有5个分散的村庄,其大致位置坐标(单位:km)如下:A(1,2)、B(3,5)、C(5,4)、D(7,6)、E(9,8);
为改善交通,计划修建一条笔直的公路,要求这条公路尽可能“贴近”所有村庄(即让各村庄到公路的垂直距离平方和最小)。
(1)若公路方程为y=kx+b,根据直线拟合的最小二乘法思想,列出计算斜率k和截距b的方程组;
(2)结合实际,分析为什么最终修建的公路可能与(1)中拟合的直线不完全一致。
曲线拟合—插值
插值的核心概念: 插值是一种通过已知数据点构建函数的方法,其核心目标是:构造一个函数,使其精确经过所有已知的数据点,并可用于在这些点之间的区间内估算未知值。 简单来说,若已知一组离散数据点 (x 1 ,y 1 ),(x 2 ,y 2 ),...,(x n ,y n ) ,插值就是找到一个函数 y=f(x) ,满足 f(x i )=y i ( i=1,2,...,n ),且该函数在数据点之间连续变化。
189
学科网(北京)股份有限公司
$