Download presentation
Presentation is loading. Please wait.
1
数学实验之 回归分析(2)
2
第二讲:多元线性与非线性回归分析 实验 简介多元 非线性回归模型 MATLAB软件实现 多元线性回归模型 引例:某建材公司的销售量因素分析
3
实验目的 1)了解回归分析的基本原理; 2)掌握MATLAB的实现方法; 3)练习用回归分析方法解决实际问题;
4
引例:某建筑材料公司的销售量因素分析 某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回归模型,且分析哪些是主要的影响因素。 设:推销开支——x1 实际帐目数——x2 同类商品竞争数——x3 地区销售潜力——x4
5
X= 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 5.5 2.5 8.0 3.0 2.9 9.0 4.0 6.5 5.0 6.0 3.5 7.5 7.0 31 55 67 50 38 71 30 56 42 73 60 44 39 70 40 62 59 79.3 200.1 163.2 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0 x x x x y 1 .
6
寻找关系: y = E(Y|x1,x2,x3,x4) = f(x1,x2,x3,x4) 假设: 1、因变量Y是随机变量,并且它服从正态分布; 2、f(x1,x2,x3,x4)是线性函数(非线性); 模型:
7
2、多元线性回归模型 模型要解决的问题可归纳为以下几个方面: 1) 在回归模型中如何估计参数βi (i=0,1,…,m)和σ2?
知识介绍 2、多元线性回归模型 模型要解决的问题可归纳为以下几个方面: 1) 在回归模型中如何估计参数βi (i=0,1,…,m)和σ2? 2) 模型的假设(线性)是否正确? 3) 判断每个自变量xi (i=1,…,m)对Y的影响是否显著? 4) 利用回归方程对试验指标 Y进行预测或控制?
8
参数估计 假设有n个独立观测数据(xi1,xi2,…xim,yi), i = 1,2,…,n, 要确定回归系数 由最小二乘法
9
求解结果 y的估计值: 拟合误差e = y – y 称为残差, 残差平方和
10
统计分析 1、β是β的线性最小方差无偏估计 2、 3、残差平方和Q, 由此得σ2的无偏估计 4、对Y的样本方差S2进行分解
11
回归模型的假设检验 构造F-统计量及检验H0的拒绝域: 注意:衡量y与x1,x2,…,xm相关程度的指标可以定义复相关系数R,R的值越接近于1,它们的相关程度越密切。
12
回归系数的检验 主要判断每个自变量xi对y的影响是否显著。 由此可得
13
[b, bint, r, rint, stats] = regress(Y, X, alpha)
MATLAB软件实现 1、使用命令regress实现多元线性回归 b = regress (Y, X) 或 [b, bint, r, rint, stats] = regress(Y, X, alpha) 回归系数β0,β1,…,βm以及它们的置信区间 相关系数R2,F-统计量和与F对应的概率p。 残差向量e=Y-Y及它们的置信区间
14
引例求解: 输入:(jzhui.m) x1=[5.5 2.5 8 3 ……8 6 4 7.5 7]’;(20维)
y=[ …… ]'; X=[ones(size(x1)),x1,x2,x3,x4]; [b,bint,r,rint,stats]=regress(y,X)
15
计算结果: (输出) b = β β β β β4 bint = ……(系数的置信区间) r =[ …… ] rint=(略) stats = (R2) (F) (p) Q = r’*r σ2= Q/(n-2) = (近似)
16
残差向量分析图
17
如何分析四个因素x1,x2,x3,x4 对试验指标Y的作用大小?
使用逐步回归方法。在MATLAB软件中使用以下命令: stepwise(X, y, inmodel,alfha) 如上例,输入: X=[x1,x2,x3,x4]; stepwise(X,y,[1,2,3])
18
模型中均方差历史数据记载表 参变量数据分析表
20
经过观察,得到各种情况下的均方差对比: 变量组合 x1,x2 x1,x3 x1,x4 x2,x3 x2,x4 x3,x4 RMSE 53 51.96 61.77 23.96 52.96 44.75 变量 组合 x1,x2 x3 x1, x2 x4 x1, x3 x4 x2,x3 x3,, x4 RMSE 24.65 54.43 45.86 24.64 25.39
21
最佳回归方程
22
范例: 某化学反应问题 1、问题 这是一个非线性回归模型的实例
为了研究三种化学元素:氢、n戊烷和异构戊烷与生成物的反应速度Y(%)之间的关系,经试验测定得到某些数据。试建立非线性回归模型,并进行统计分析。
23
2、假设及建模 ① 在各因素与指标(因变量)之间的信息“一无所知”的情况下,假设模型Y = f (x1,x2,x3)+ε中的函数f 是多项式形式,即 y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + (linear terms) b 12 x 1 x 2 + b 13 x 1 x 3 + b 23 x 2 x 3 + (interaction terms) b 11 x b 22 x b 33 x (quadratic terms) ~ N(0, 2)
24
在MATLAB软件下,实现二次多项式回归分析的命令: rstool(X, y, ‘model’, alpha) (它将产生一个交互式的界面)
linear:(缺省)y = β0+β1x1+…+βmxm purequadratic: y = β0+β1x1+…+βmxm +∑j=1 to mβj*xj2 interaction: y = β0+β1x1+…+βmxm +∑1≤j≠k≤ mβjkxjxk quadratic(完全二次,以上模型之和)
25
load reaction(调出数据) Whos (查看数据名称及大小) Name Size Bytes Class beta x double array model x char array rate x double array reactants x double array xn x char array yn x char array 因变量Y 三个自变量
26
X=reactants; y=rate; rstool(X,y,'quadratic') Export Parameters Linear
RMSE Residuals All Linear Pure Quadratic Interactions Full Quadratic User Specified
27
在工作空间可以分别给出参数估计值、残差平方和、残差向量。
28
nlintool(X,y, 'model', beta)
② 假定由实际问题背景分析知经验公式为: MATLAB实现 非线性回归 nlintool(X,y, 'model', beta) 以M-文件形式建立模型 模型中未知参数向量
29
2)一般的非线性模型及拟合 建立M函数文件 (hougen.m); 执行 (hgy3.m) nlinfit(X,y ,'hougen',beta) nlintool(X,y,'hougen',beta,0.01) MATLAB 要辩识的参数
30
实验内容 2、某公司出口换汇成本分析 对经营同一类产品出口业务的公司进行抽样调查, 被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本。
31
公司 出口换汇成本 人民币元/美元 商品流转费 用率(%) 1 2 3 4 5 6 7 1.40 1.20 1.00 1.90 1.30
2.40 4.20 5.30 7.10 3.70 6.20 3.50 4.80 8 9 10 11 12 13 1.60 2.00 1.80 5.50 4.10 5.00 4.00 3.40 6.90
Similar presentations