Excel在报表分析中应用 潘雷驰 2019/4/4
授课提纲 数据的整理 标准值的确定与对象筛选 税收遵从风险评价 相关、回归分析与预测 2019/4/4
数据的整理 常用快捷键 选择性粘贴 文本格式转换 排序 数据透视表 查找 数据的有效性 条件格式 2019/4/4
标准值的确定与对象筛选 计算描述数据的指标: 平均值 中位数 标准差 2019/4/4
平均值: 即指样本的算术平均值 易受极端值影响 样本的选择:同行业、同产品、同利润水平 2019/4/4
中位数: 一组数从小到大排列,位置处在中间的数 不易受到极端值影响 2019/4/4
标准差: 样本偏离平均值的程度 2019/4/4
离差的涵义 1 2 3 4 5 6 7 8 3 1 -1 -2 -1 2019/4/4
预警区间: 2019/4/4
几个方面的改变: 均值选择总体平均值 预警范围: 2019/4/4
税收遵从风险评价 税收遵从风险综合评价模型由财务指标、分析指标、预警参数、问题描述、得分情况等五个大项组成。主要利用纳税人每月征期申报的资产负债表、利润表、增值税纳税申报表中的指标和增值税专用发票用量情况,借助财务分析、数理统计分析等方法,来分析纳税人的营运能力、盈利能力、发展能力等八个方面的情况,据此对纳税人进行综合评判,最后确定对纳税人实行的管理办法,包括日常监控、重点监控、即时跟踪等。 2019/4/4
相关、回归分析与预测 客观现象之间的数量联系存在着两种不同的类型: 一种是函数关系 另一种是相关关系 2019/4/4
按照相关程度分类 x y 不相关 相关 x y x y 完全相关 2019/4/4
按照相关形式分类 x y 直线相关 x y 曲线相关 2019/4/4
按照相关方向分类 x y 正相关 x y 负相关 2019/4/4
总体相关系数的定义式是: 样本相关系数的定义公式是: 2019/4/4
r=0只是表明两个变量之间不存在线性关系.它并不意味着X与Y之间不存在其他类型的关系。 r>0 为正相关,r < 0 为负相关 r=1,完全正相关,r=-1,完全负相关。 r=0只是表明两个变量之间不存在线性关系.它并不意味着X与Y之间不存在其他类型的关系。 2019/4/4
回归分析 回归分析: 指根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法。 2019/4/4
随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响 X对Y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。 回归方程的内涵 随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响 X对Y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。 2019/4/4
残差(Residual): e 2019/4/4
回归分析的主要任务就是要建立能够近似反映真实总体回归函数的样本回归函数。通常采用残差平方和作为衡量总偏差的尺度。所谓最小二乘法就是根据这一思路,通过使残差平方和为最小来估计回归系数的一种方法。 2019/4/4
拟合程度的评价 所谓拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。判断回归模型拟合程度优劣最常用的数量指标是称为可决系数(又称决定系数)。该指标是建立在对总离差平方和进行分解的基础之上的。 2019/4/4
总离差平方和的分解 剩余残差平方和 回归离差平方和 总离差平方和 2019/4/4
可决系数是对回归模型拟合程度的综合度量,可决系数越大,模型拟合程度越高。可决系数越小,则模型对样本的拟合程度越差。 2019/4/4
从可决系数的计算公式中,可以看出可决系数是介于从0到1的数,越接近于1说明回归拟合效果越好,一般地,如果可决系数的取值超过0 从可决系数的计算公式中,可以看出可决系数是介于从0到1的数,越接近于1说明回归拟合效果越好,一般地,如果可决系数的取值超过0.8,认为模型的拟合效果比较高。 2019/4/4