应用运筹学 第六章 预测技术与概率统计 浙江大学管理学院 杜红 博士 副教授
第六章 预测技术与概率统计 预测与预测技术 概率与概率分布 统计分析
预测与预测技术 预测 对未来的发展作出科学的估计,对当前决策具有重要作用的、未来不确定的因素提供信息、数据。 预测技术 定性(判断)预测:主观判断和专家意见 个人见解、座谈、市场调查、历史类推、德尔菲法 定量预测:运用数理统计和因果关系 外推法(时间序列分析)、因果法(回归分析)
预测与预测技术 判断预测适用条件 方法 精确性 成本 短期 中期 长期 个人见解 座谈会讨论 市场调查 历史类推 德尔菲法 差 稍差 很好 较好 好 稍好 可以 低 高 中 稍高
预测与预测技术 时间序列 延续性:过去的状况会延续到未来 不规律:不考虑因果关系,着眼于消除不规律因素(偶然性因素)的干扰。把时间序列作为随机变量序列,运用数学平均或加权平均的方法,作出趋势预测。 常数序列、趋势序列、季节性序列、周期序列
预测与预测技术 时间序列分析方法--移动平均法 假设未来状况只与邻近几期的状况有关 D(t):第t个周期的实际值 F(t+1):第(t+1)个周期的预测值 N:与预测期邻近的有关的周期数 W(t):D(t)对应的权重
预测与预测技术 时间序列分析方法--指数平滑法 F(t+1)=αD(t)+(1-α)F(t) α为平滑系数,介于0,1之间 上式等价于: F(t+1)=αD(t)+α (1-α)D(t-1) + α (1-α)2D(t-2)+… α值根据实际情况确定,如要加强近期数据作用,则应取较大值。
预测与预测技术 利用EXECL计算趋势预测值 已知某公司前11个月的销售额,它不符合回归预测拟合曲线,使用移动平均和指数平滑方法预测该公司12月份的销售额。 注意:EXECL指数平滑计算中需输入的是阻尼系数而不是平滑系数,阻尼系数+平滑系数=1 月份 1 2 3 4 5 6 7 8 9 10 11 销售额 200 185 195 197 210 203 230 220 270 235
预测与预测技术 预测精度 平均误差(ME) 平均绝对误差(MAD) 均方差(MSE)
预测与预测技术 因果分析预测 自变量:独立变量,不受其它变量影响 因变量:非独立变量,受其它变量影响 自变量与因变量之间存在因果关系 一元线性回归与多元线性回归 因变量按线性关系依存于自变量 一元回归:因变量、自变量均只有一个 多元回归:因变量一个,自变量多个
预测与预测技术 一元线性回归预测模型 Y=a+bX 预测模型 Yi=a+bXi+Ei Ei 为预测误差 求均方差(MSD)最小(最小二乘法)时a,b值?
预测与预测技术 回归精度--确定性系数R2 “解释的变异”部分 Y 比重越大说明回归 的精度越高。 确定性系数为解 释的变异占总变异 的比值。 Y Y 回归线(Y’) 未解释的变异 总的变异 均值 从中图可以看出: 由此也可以证明: 解释的变异 X
预测与预测技术 确定性系数R2的计算 总平方和 回归平方和 误差平方和 (X,Y 相关系数的平方)
预测与预测技术 一元线性回归模型应用举例 某商业部门要求预测2002年某商品的销售总额。收集了该地1990-2000年该商品销售总额和职工工资总额的数据。预计2002年工资总额比2000年增长20%。 年份 90 91 92 93 94 95 96 97 98 99 00 销售额 19.5 22.2 24.9 25.2 29.1 34.5 41.1 46.2 53.1 61.5 66.9 工资额 61 75 107 146 174 211 244 298 349 380
预测技术:一元线性回归模型应用举例 建立模型(需作线性检验): Y=a+bX Y:销售额 X: 工资额 a,b :回归系数 计算结果: a=8.85 , b=0.15 , R2=.99 回归方程: Y=8.85+0.15X 2002年销售预测: 工资总额:380×120%=456 销售总额:8.85+0.15×456=77.25
预测与预测技术 模型预测 将观测值分成若干部分,分别预测 季节性和趋势性模型(了解思路,计算不要求) 趋势:两个连续时期的需求变动 季节:有规律的循环变化状态 季节指数:季节性值/非季节性值 模型预测 将观测值分成若干部分,分别预测 基本值 Ut、趋势Tt、季节指数In、干扰值Nt F(t+1)=[Ut+ Tt]× In
预测与预测技术 季节性和趋势性模型预测值的组成 无干扰 需求 季节因素 趋势调整 基本值
概率与概率分布 独立事件概率 互斥事件:a发生b不可能发生 b发生a不可能发生 a或b发生的概率=a、b各自发生概率和 加法定理: P(a+b)=P(a)+P(b) 独立事件:a发生对b是否发生不产生影响 b发生对a是否发生不产生影响 a和b同时发生的概率= a、b各自概率的积 乘法定理:P(a·b)=P(a) ·P(b)
概率与概率分布 非独立事件的条件概率 非独立事件:一个事件的发生受另一事件 是否发生的影响 贝叶斯定理:两个相互依存事件都发生的 概率是第一事件发生的概率 乘以在第一事件发生情况下 第二个事件发生的条件概率 P(a·b)=P(a) ·P(b︱a) = P(b) ·P(a︱b) 条件概率: P(a︱b)= P(a·b)/ P(b)
概率与概率分布 正态分布 正态分布图: 概率与标准差之间关系 -∞ +∞ -3 -2 -1 +1 +2 +3 Y 负偏态 正偏态 Z -∞ +∞ μ -3 -2 -1 +1 +2 +3 68.26% 95.45% 99.73%
概率与概率分布 标准正态分布 令 (将x值转换成标准Z分数) 则: 标准正态分布的均值、方差和分布函数:
概率与概率分布 二项分布 两个对立 事件(成功或失败)的概率分布 n次试验中有r次成功,成功的概率为p,失败为q。 当P≤q,np≥5(或q≤p,nq≥5)时二项分布接 近正态分布。 二项分布的均值与标准差:
概率与概率分布 二项分布应用: 有判断题(对错)10题,回答者答对几题才能认为他是真会(不是出于猜测)? (置信度95%,正态分布Z=1.645时该点下(单测左边)包含全体的95%。) 对错的概率均为0.5,p=q=0.5,np=5, 此二项分布接近正态分布。 μ=np=5, = 1.58 X= μ+ 1.645σ= 7.6≈ 8 可以推论:10题中猜对8题以下的可能性为95%。
概率与概率分布 泊松分布 随机事件,成功与失败的概率相差悬殊(只关注一种概率),简化的二项分布(n很大,P很小) 分布函数(n次试验中r次成功的概率) 泊松分布的均值与标准差: 其中: μ 为平均成功的次数,且 μ = np
概率与概率分布 泊松分布的应用 应用最广的分布之一。 很多“排队”问题都可近似地用泊松分布来描绘。如某段时间内交换台接到电话用户的呼叫次数,候车室内旅客的人数,各种事故、自然灾害、不常见病、不幸事件在一定时间内发生的次数等随机现象都接近泊松分布。
统计分析与检验 基本统计量(SPSS统计软件) 平均数(算术、加权、几何平均数) 中 数:序列中间位置的那个数 众 数:出现次数最多的那个数 中 数:序列中间位置的那个数 众 数:出现次数最多的那个数 方 差:每个数据与该组平均数之差平方后 的均值 标准差:方差的平方根 相关系数:两列相关数据的关系密切程度
统计分析与检验 总体与样本 总体 样本 样本均值 分布 正态 正态 正态 (n≥30) 均值 μ= μ 标准差(误)σ= 总体 样本 样本均值 分布 正态 正态 正态 (n≥30) 均值 μ= μ 标准差(误)σ= 总体均值的95%置信区间为: 到
统计分析与检验 假设检验 对从样本数据估计得到的关于总体特征结果的检验。 假设检验的错误: I类错误:拒绝一个实际上是真的假设 II类错误:没有拒绝一个实际上是错的假设 显著性水平 最低可接受概率,样本值概率大于此值不拒绝 .05水平与.01水平