第8章 概率论与数理统计问题的求解 概率分布与伪随机数生成 统计量分析 数理统计分析方法及计算机实现 统计假设检验 方差分析及计算机求解.

Slides:



Advertisements
Similar presentations
完美殺人筆記簿 【爸!我受夠了!】 第七組組員: 林正敏 陳筱涵 李蓓宇 許純宜 羅玉芬 謝文軒.
Advertisements

2, 多情总为无情伤 3, 南屏晚钟 4, 绿岛小夜曲 5, 千里之外 6, 月圆花好 1, 一剪梅 按上键选择或自动播放, 退出按 :  费玉清演唱的歌 请听费玉清演唱的歌 6301 编制.
第 5 章 中國的都市.
XX啤酒营销及广告策略.
成功八步 成功一定有方法 失败一定有原因 银河系统.
第一节 人口的数量变化.
第四章:长期股权投资 长期股权投资效果 1、控制:50%以上 有权决定对方财务和经营.
做 荷 包 的 主 人 第 一 桶 金 督導 張宏仁 財團法人「張老師」基金會 桃園分事務所 督導 張宏仁
郑州新世纪女子医院是一家专业治乳腺疾病的特色专科医院,巨资引进一系列全进口尖端设备,汇集全国著名乳腺病专家及知名乳腺病外科专家组,以"打造专业品牌、创建专科名院"的办院方针,以科学规范防治乳腺病与乳腺癌为重点,以女性身心健康为目标,遵循"敬爱生命","亲情、温馨、真诚"的人性化理念服务于患者,提供系统、全面、专业化的医疗服务,构建女人的温馨家园。
小学科学中的化学 武威十九中 刘玉香.
成才之路 · 语文 人教版 • 中国古代诗歌散文欣赏 路漫漫其修远兮 吾将上下而求索.
与优秀的人在一起
第二章 复式记账原理*** 主要内容、重点难点: 1.会计要素与会计等式*** 2.会计科目与账户*** 3. 借贷记账法***
如何提昇兒童語言及學習能力.
2011年10月31日是一个令人警醒的日子,世界在10月31日迎来第70亿人口。当日凌晨,成为象征性的全球第70亿名成员之一的婴儿在菲律宾降生。 ?
复习回顾 … , 1、算术平均数的概念: 一般地,对于n个数 我们把 叫做这n个数的算术平均数,简称平均数. 2、加权平均数的定义
國小學童性教育介入行動研究— 以屏東縣里港國民小學五年級學生為例
第七章 田 径 运 动 场 地.
江苏省2008年普通高校 招生录取办法 常熟理工学院学生处
合 同 法 主讲人: 教材:《合同法学》(崔建远) 2017/3/10.
姓名:劉芷瑄 班級:J201 座號:39號 ISBN:957-33-1963-2
小微企业融资担保产品介绍 再担保业务二部 贾天
1、分别用双手在本上写下自己的名字 2、双手交叉
初级会计实务 第八章 产品成本核算 主讲人:杨菠.
中國古鎖大觀 中國鎖具歷史悠久,據出土文物考證和歷史文獻記載,鎖具發展至今有五千年歷史。古鎖初稱牡、閉、鑰、鏈、鈐。早期為竹、木結構,起源於門閂。春秋戰國至魯班於木鎖內設堂奧機關,至東漢制金屬簧片結構鎖(又稱溝槽鎖)。入唐時所之多為金、銀、銅、鐵、木。明代遂成為廣鎖、花旗鎖、首飾鎖、刑具鎖四大類。實際上還有一類密碼鎖,只是不太常見罷了。
四年級課程綱要細目解讀 第四組 冠瑛、家珍、惠卿、琬婷.
2007年11月考试相关工作安排 各考试点、培训中心和广大应考人员:
中考阅读 复习备考交流 西安铁一中分校 向连吾.
分式的乘除(1) 周良中学 贾文荣.
第四章 制造业企业 主要经济业务核算.
《北京地区进出口企业 检验检疫信用管理办法》解读
物理精讲精练课件 人教版物理 八年级(下).
南宁市兴宁区社区档案整理办法 南宁市兴宁区档案局 2010年 地址:南宁市厢竹大道63号兴宁区政府4楼
古文閱讀 – 像虎伏獸 明 劉基 組員: 5號江依倫 6號江若薇 12號張珉芫 32號蔡燕如.
《思想品德》七年级下册 教材、教法与评价的交流 金 利 2006年1月10日.
我国的宗教政策 第七课第三框.
中央广播电视大学开放教育 成本会计(补修)期末复习
高级财务管理 主讲: 杨业中.
电话联系.
迎宾员礼仪 包头机电工业职业学校管理系 白琳 1.
人教版义务教育课程标准实验教科书 小学数学四年级上册第七单元《数学广角》 合理安排时间 248.
市级个人课题交流材料 《旋转》问题情境引入的效果对比 高淳县第一中学 孔小军.
常用逻辑用语复习.
栖霞区初三“千人培优”空中课堂 数据的集中趋势和离散程度 王 涵 2015年12月27日.
我国三大自然区.
第十二单元 第28讲 第28讲 古代中国的科技和文艺   知识诠释  思维发散.
我是情緒管理小高手 黃玲蘭老師.
性別透視鏡 鳳鳴電台 高宜君老師.
财 务 会 计 第四篇:供应链会计实务 制作人:谌君、熊瑜.
小学数学知识讲座 应用题.
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
倒装句之其他句式.
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
XX信托 ·天鑫 9号集合资金信托计划 扬州广陵
我的家乡——南昌 演讲人:XX.
機車第六篇 事故預防 單元二 行駛中注意事項.
三角形的邊角關係 大綱:三角形邊的不等關係 三角形邊角關係 樞紐定理 背景知識:不等式 顧震宇 台灣數位學習科技股份有限公司.
第 22 课 孙中山的民主追求 1 .近代变法救国主张的失败教训: “师夷之长技以制 夷”“中体西用”、兴办洋务、变法维新等的失败,使孙中山
指導老師:蘇明俊 組員: 陳柔安 潘依蓮 張壹凱
第八章 运动和力 第1节 牛顿第一定律和惯性 (第2课时  惯性).
圓周 認識圓 圓的認識 圓面積.
學這些有什麼好處呢? 為了把資料作更客觀之總結描述或比較多組資料。總而言之,就是要找出一個數能代表整組數據。
商事法報告 - 第六組 組長:陳雅琪 4A 組員:陳孟瑄 4A 林庭意 4A 黃婉婷 4A360020
點 與 線.
台灣藝術家──李梅樹 李梅樹 班級:708 組別:第五組 指導老師:陳育淳.
§12-5 同方向同频率两个简谐振动的合成 一. 同方向同频率的简谐振动的合成 1. 分振动 : 2. 合振动 : 解析法
~˙好吃餅乾˙~ 不吃光看就可讓人有百分百幸福感的烘焙點心,絕對非餅乾莫屬。簡單易學的過程和不算麻煩的製作過程,都一再吸引著初學者躍躍欲試的心。想體會餅乾的好滋味嗎?想從點心烘焙上獲得莫大的成就感嗎?不論是薄的或厚的餅乾,輕輕咬上一口,心中馬上就可洋溢著滿滿的幸福感,心動了嗎?準備好,跟著我們一起在家動手作屬於自己特有的餅乾吧!
臺中市龍山國小 校園常見瓢蟲辨識   瓢蟲屬於鞘翅目瓢蟲科。目前世界上約有5000多種瓢蟲,台灣地區約有80種以上,其中能捕食有害生物的瓢蟲約七十種之多。瓢蟲因為捕食有害生物為主食,所以又稱為『活農藥』。
畢氏定理(百牛大祭)的故事 張美玲 製作 資料來源:探索數學的故事(凡異出版社).
102年人事預算編列說明 邁向頂尖大學辦公室製作.
Presentation transcript:

第8章 概率论与数理统计问题的求解 概率分布与伪随机数生成 统计量分析 数理统计分析方法及计算机实现 统计假设检验 方差分析及计算机求解

8.1概率分布与伪随机数生成 8.1.1 概率密度函数与分布函数概述 8.1概率分布与伪随机数生成 8.1.1 概率密度函数与分布函数概述

通用函数计算概率密度函数值 函数 pdf 格式 P=pdf(‘name’,K,A) P=pdf(‘name’,K,A,B) P=pdf(‘name’,K,A,B,C) 说明 返回在X=K处、参数为A、B、C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名。 例如二项分布:设一次试验,事件Y发生的概率为p,那么,在n次独立重复试验中,事件Y恰好发生K次的概率P_K为:P_K=P{X=K}=pdf('bino',K,n,p)

例: 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。 解: >> pdf('norm',0.6578,0,1) ans = 0.3213 例:自由度为8的卡方分布,在点2.18处的密度函数值。 解: >> pdf('chi2',2.18,8) 0.0363

随机变量的累积概率值(分布函数值) 通用函数cdf用来计算随机变量的概率之和(累积概率值) 函数 cdf 格式 cdf(‘name’,K,A) cdf(‘name’,K,A,B) cdf(‘name’,K,A,B,C) 说明 返回以name为分布、随机变量X≤K的概率之和的累积概率值,name为分布函数名.

例: 求标准正态分布随机变量X落在区间(-∞,0.4)内的概率。 解:>> cdf('norm',0.4,0,1) ans = 0.6554 例:求自由度为16的卡方分布随机变量落在[0,6.91]内的概率。 解:>> cdf('chi2',6.91,16) 0.0250

随机变量的逆累积分布函数 MATLAB中的逆累积分布函数是已知,求x。 命令 icdf 计算逆累积分布函数 格式 icdf(‘name’,F,A) icdf(‘name’,F,A,B) icdf(‘name’,F,A,B,C) 说明 返回分布为name,参数为a1,a2,a3,累积概率值为P的临界值,这里name与前面相同。 如果F= cdf(‘name’,X,A,B,C) , 则 X = icdf(‘name’,F,A,B,C)

例:在标准正态分布表中,若已知F=0.6554,求X 解: >> icdf('norm',0.6554,0,1) ans = 0.3999 例:公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,6),求车门的最低高度。 解:设h为车门高度,X为身高。 求满足条件 F{X>h}<=0.99,即 F{X<h}>=0.01故 >> h=icdf('norm',0.99, 175, 6) h = 188.9581

8.1.2 常见分布的概率密度函数与分布函数 8.1.2.1 Poisson分布 其要求x是正整数。

其中:x为选定的一组横坐标向量, y为x各点处的概率密度函数值。

例:绘制 l =1,2,5,10 时 Poisson 分布的概率密度函数与概率分布函数曲线。 >> x=[0:15]'; y1=[]; y2=[]; lam1=[1,2,5,10]; >> for i=1:length(lam1) y1=[y1,poisspdf(x,lam1(i))]; y2=[y2,poisscdf(x,lam1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.2.2 正态分布 正态分布的概率密度函数为:

例: >> x=[-5:.02:5]'; y1=[]; y2=[]; >> mu1=[-1,0,0,0,1]; sig1=[1,0.1,1,10,1]; sig1=sqrt(sig1); >> for i=1:length(mu1) y1=[y1,normpdf(x,mu1(i),sig1(i))]; y2=[y2,normcdf(x,mu1(i),sig1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.2.3 分布

例:绘制 为(1,1),(1,0.5),(2,1),(1,2),(3,1)时 >> x=[-0.5:.02:5]‘; %x=[-eps:-0.02:-0.5,0:0.02:5]; x=sort(x’);替代 >> y1=[]; y2=[]; a1=[1,1,2,1,3]; lam1=[1,0.5,1,2,1]; >> for i=1:length(a1) y1=[y1,gampdf(x,a1(i),lam1(i))]; y2=[y2,gamcdf(x,a1(i),lam1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.2.4 分布(卡方分布) 其为一特殊的 分布 ,a=k/2, l =1/2。

例: >> x=[-eps:-0.02:-0.5,0:0.02:2]; x=sort(x'); >> k1=[1,2,3,4,5]; y1=[]; y2=[]; >> for i=1:length(k1) y1=[y1,chi2pdf(x,k1(i))]; y2=[y2,chi2cdf(x,k1(i))];end >> plot(x,y1), figure; plot(x,y2)

8.1.2.5 分布 概率密度函数为: 其为参数k的函数,且k为正整数。

例: >> x=[-5:0.02:5]'; k1=[1,2,5,10]; y1=[]; y2=[]; >> for i=1:length(k1) y1=[y1,tpdf(x,k1(i))]; y2=[y2,tcdf(x,k1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.2.6 Rayleigh分布

例: >> x=[-eps:-0.02:-0.5,0:0.02:5]; x=sort(x'); >> b1=[.5,1,3,5]; y1=[]; y2=[]; >> for i=1:length(b1) y1=[y1,raylpdf(x,b1(i))]; y2=[y2,raylcdf(x,b1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.2.7 F 分布 其为参数p,q的函数,且p,q均为正整数。

例:分别绘制(p,q)为(1,1),(2,1),(3,1)(3,2),(4,1)时F分布的概率密度函数与分布函数曲线。 >> x=[-eps:-0.02:-0.5,0:0.02:1]; x=sort(x'); >> p1=[1 2 3 3 4]; q1=[1 1 1 2 1]; y1=[]; y2=[]; >> for i=1:length(p1) y1=[y1,fpdf(x,p1(i),q1(i))]; y2=[y2,fcdf(x,p1(i),q1(i))]; end >> plot(x,y1), figure; plot(x,y2)

8.1.3 概率问题的求解 图4-9

例: >> b=1; p1=raylcdf(0.2,b); p2=raylcdf(2,b); P1=p2-p1 P1 = 0.8449 >> p1=raylcdf(1,b); P2=1-p1 P2 = 0.6065

例: >> syms x y; f=x^2+x*y/3; >> P=int(int(f,x,0,1/2),y,0,1/2) P = 5/192 >> syms x y; f=x^2+x*y/3; P=int(int(f,x,0,1),y,0,2) 1

8.1.4 随机数与伪随机数

例: >> b=1; p=raylrnd(1,30000,1); >> xx=0:.1:4; yy=hist(p,xx); % hist()找出随机数落入各个子区间的点个数,并由之拟合出生成数据的概率密度。 >>yy=yy/(30000*0.1); >> bar(xx,yy), >> y=raylpdf(xx,1); >> line(xx,y)

8.2 统计量分析 8.2.1 随机变量的均值与方差

例: 均值 >> syms x; syms a lam positive >> p=lam^a*x^(a-1)/gamma(a)*exp(-lam*x); >> m=int(x*p,x,0,inf) m = 1/lam*a 方差 >> s=simple(int((x-1/lam*a)^2*p,x,0,inf)) s = a/lam^2

已知一组随机变量样本数据构成的向量: 求该向量各个元素的均值、方差和标准差、中位数median

例:生成一组 30000 个正态分布随机数,使其均值为 0. 5,标准差为1 例:生成一组 30000 个正态分布随机数,使其均值为 0.5,标准差为1.5,分析数据实际的均值、方差和标准差,如果减小随机变量个数,会有什么结果? >> p=normrnd(0.5,1.5,30000,1);[mean(p),var(p),std(p)] ans = 0.4879 2.2748 1.5083 300个随机数 >> p=normrnd(0.5,1.5,300,1);[mean(p),var(p),std(p)] 0.4745 1.9118 1.3827 %可见在进行较精确的统计分析时不能选择太小的样本点。

例: >> [m,s]=raylstat(0.45) m = 0.5640 s = 0.0869

8.2.2 随机变量的矩

例: 求解原点矩 >> syms x; syms a lam positive; p=lam^a*x^(a-1)/gamma(a)*exp(-lam*x); >> for n=1:5, m=int(x^n*p,x,0,inf), end m = 1/lam*a 1/lam^2*a*(a+1) 1/lam^3*a*(a+1)*(a+2) 1/lam^4*a*(a+1)*(a+2)*(a+3) 1/lam^5*a*(a+1)*(a+2)*(a+3)*(a+4) %有规律

>> syms n; m=simple(int((x)^n*p,x,0,inf)) %直接求出 lam^(-n)*gamma(n+a)/gamma(a) >> for n=1:6, s=simple(int((x-1/lam*a)^n*p,x,0,inf)), end %中心距 s = a/lam^2 2*a/lam^3 3*a*(a+2)/lam^4 4*a*(5*a+6)/lam^5 5*a*(3*a^2+26*a+24)/lam^6 %好像无规律

例:考虑前面的随机数,可以用下面的语句得出随机数的各阶矩。 >> A=[]; B=[]; p=normrnd(0.5,1.5,30000,1); n=1:5; >> for r=n, A=[A, sum(p.^r)/length(p)]; B=[B,moment(p,r)]; end >> A,B A = 0.5066 2.4972 3.5562 18.7530 41.5506 B = 0 2.2405 0.0212 15.1944 0.0643

求各阶距的理论值: >> syms x; A1=[]; B1=[]; p=1/(sqrt(2*pi)*1.5)*exp(-(x-0.5)^2/(2*1.5^2)); >> for i=1:5 A1=[A1,vpa(int(x^i*p,x,-inf,inf),12)]; B1=[B1,vpa(int((x-0.5)^i*p,x,-inf,inf),12)]; end >> A1, B1 A1 = [ .500000000001, 2.50000000000, 3.50000000001, 18.6250000000, 40.8125000000] B1 = [ 0, 2.25000000000, 0, 15.1875000000, 0]

8.2.3 多变量随机数的协方差分析

例: >> p=randn(30000,4); cov(p) ans = 1.0033 0.0131 0.0036 0.0020 0.0131 1.0110 0.0061 -0.0154 0.0036 0.0061 1.0055 -0.0004 0.0020 -0.0154 -0.0004 0.9881

8.2.4 多变量正态分布的联合概率 密度即分布函数

例: >> mu1=[-1,2]; Sigma2=[1 1; 1 3]; % 输入均值向量和协方差矩阵 >> [X,Y]=meshgrid(-3:0.1:1,-2:0.1:4); xy=[X(:) Y(:)]; % 产生网格数据并处理(两列2501*2 ) >> p=mvnpdf(xy,mu1,Sigma2); % 求取联合概率密度 >> P=reshape(p,size(X)); %Change size(2501*1—61*41) >> surf(X,Y,P)

对协方差矩阵进行处理,可计算出新的联合概率密度函数。 >> Sigma2=diag(diag(Sigma2)); % 消除协方差矩阵的非对角元素 >> p=mvnpdf(xy,mu1,Sigma2); P=reshape(p,size(X)); surf(X,Y,P) R为m行n列。

例: >> mu1=[-1,2]; Sigma2=[1 1; 1 3]; >> R1=mvnrnd(mu1,Sigma2,2000); plot(R1(:,1),R1(:,2),'o') >> Sigma2=diag(diag(Sigma2)); figure; >> R2=mvnrnd(mu1,Sigma2,2000); plot(R2(:,1),R2(:,2),'o')

8.3数理统计分析方法及计算机实现 8.3.1 参数估计与区间估计 8.3数理统计分析方法及计算机实现 8.3.1 参数估计与区间估计 无论总体X的分布函数 的类型已知或未知,我们总是需要去估计某些未知参数或数字特征,这就是参数估计问题.即参数估计就是从样本 出发,构造一些统计量 (i=1,2,…,k)去估计总体X中的某些参数(或数字特征) (i=1,2,…,k).这样的统计量称为估计量.

1、点估计:构造 的函数 作为参数 的点估计量, 称统计量 为总体X参数 的点估计量. 2.   区间估计:构造两个函数 (X1,X2,…, Xn)和 (X1,X2,…, Xn)做成区间,把 这 作为参数 的区间估计.

区间估计的求法 设总体X的分布中含有未知参数 ,若对于给定的概率 ,存在两个统计量 (X1,X2,…,Xn)和 (X1,X2,…,Xn),使得 则称随机区间 为参数 的置信水平为 的置信区间,称 为置信下限,称 为置信上限.

由极大拟然法估计出该分布的均值、方差 及其置信区间。置信度越大,得出的置信区间越小,即得出的结果越接近于真值。 还有gamfit(), raylfit(), poissfit() ,unifit()(均匀分布) 等参数估计函数

例: >> p=gamrnd(1.5,3,30000,1); Pv=[0.9,0.92,0.95,0.98]; A=[]; >> for i=1:length(Pv) [a,b]=gamfit(p,Pv(i)); A=[A; Pv(i),a(1),b(:,1)',a(2),b(:,2)'] end >> A A = 0.9000 1.5137 1.5123 1.5152 2.9825 2.9791 2.9858 0.9200 1.5137 1.5126 1.5149 2.9825 2.9798 2.9851 0.9500 1.5137 1.5130 1.5144 2.9825 2.9808 2.9841 0.9800 1.5137 1.5135 1.5140 2.9825 2.9818 2.9831

>> num=[300,3000,30000,300000,3000000]; A=[]; >> for i=1:length(num) p=gamrnd(1.5,3,num(i),1); [a,b]=gamfit(p,0.95); A=[A;num(i),a(1),b(:,1)',a(2),b(:,2)']; end >> A(:,[2,3,4,5,6,7]) ans = 1.4795 1.4725 1.4865 2.9129 2.8960 2.9299 1.4218 1.4198 1.4238 3.1676 3.1623 3.1729 1.4898 1.4891 1.4904 3.0425 3.0409 3.0442 1.4998 1.4996 1.5000 3.0054 3.0049 3.0059 1.5006 1.5005 1.5007 2.9968 2.9966 2.9969 要达到参数估计效果良好,随机数不能选得太少,也不能选得太多,此例中为30000为好。

8.3.2 多元线性回归与区间估计

例: >> a=[1 -1.232 2.23 2 4 3.792]'; X=randn(120,6); y=X*a; >> a1=inv(X'*X)*X'*y;a1' ans = 1.0000 -1.2320 2.2300 2.0000 4.0000 3.7920 >> [a,aint]=regress(y,X,0.02);a',aint'

>> yhat=y+sqrt(0.5)*randn(120,1); >> [a,aint]=regress(yhat,X,0.02); >> a',aint‘ % a=[1 -1.232 2.23 2 4 3.792]' ans = 1.0576 -1.3280 2.1832 2.0151 4.0531 3.7749 0.8800 -1.5107 2.0284 1.8544 3.8788 3.6221 1.2353 -1.1453 2.3379 2.1757 4.2274 3.9276

>> errorbar(1:6, a, aint(:,1)-a, aint(:,2)-a) >> yhat=y+sqrt(0.1)*randn(120,1); >>[a,aint]=regress(yhat,X,0.02);

8.3.3 非线性函数的最小二乘参数 估计与区间估计 r为参数下的残 差构成的向量。 J为各个Jacobi 行向量构成的 矩阵。

例: >> f=inline('a(1)*exp(-a(2)*x)+a(3)*exp(-a(4)*x).*sin(a(5)*x)','a','x'); >> x=0:0.1:10; y=f([0.12,0.213,0.54,0.17,1.23],x); >> [a,r,j]=nlinfit(x,y,f,[1;1;1;1;1]); a

ans = 0.11999999763418 0.21299999458274 0.54000000196818 0.17000000068705 1.22999999996315 >> ci=nlparci(a,r,j) % [0.12,0.213,0.54,0.17,1.23] ci = 0.11999999712512 0.11999999814323 0.21299999340801 0.21299999575747 0.54000000124534 0.54000000269101 0.17000000036077 0.17000000101332 1.22999999978603 1.23000000014028

>> y=f([0.12,0.213,0.54,0.17,1.23],x)+0.02*rand(size(x)); >> [a,r,j]=nlinfit(x,y,f,[1;1;1;1;1]); a' ans = 0.12655784086874 0.17576593556541 0.54363873794463 0.17129712329146 1.23139632101927 >> ci=nlparci(a,r,j) ci = 0.12240417108574 0.13071151065174 0.16754837168468 0.18398349944614 0.53737093469422 0.54990654119504 0.16845014477426 0.17414410180866 1.22983289563708 1.23295974640145 >> errorbar(1:5,a,ci(:,1)-a,ci(:,2)-a)

例: >> a=[1;1;1;1;1;1]'; >> f=inline(['(a(1)*x(:,1).^3+a(2)).*sin(a(3)*x(:,2) ' ,... '.*x(:,3))+(a(4)*x(:,3).^3+a(5)*x(:,3)+a(6))'],'a','x'); >> X=randn(120,3); y=f(a,X)+sqrt(0.2)*randn(120,1); >> [ahat,r,j]=nlinfit(X,y,f,[0;2;3;2;1;2]); ahat ahat = 0.99166464884539 1.04776526972943 0.97668595800756 1.02022345889541 0.88639528713563 1.09317291667891

>> ci=nlparci(ahat,r,j); ci %置信区间 0.89133624667624 1.09199305101455 0.86664749663205 1.22888304282680 0.83628948119418 1.11708243482094 0.98466523279168 1.05578168499914 0.73055684224143 1.04223373202984 0.99932407018303 1.18702176317478 >> errorbar(1:6,ahat,ci(:,1)-ahat,ci(:,2)-ahat) >> y1=f(ahat,X);plot([y y1]) %绘制曲线

8.4 统计假设检验 8.4.1 正态分布的均值假设检验 若未知正态分布的标准差时,可用此函数。 H为假设检验的结论,当H=0时表示不拒绝H0假设,否则表示拒绝该假设。 s为接受假设的概率值, 为其均值的置信区间。 若未知正态分布的标准差时,可用此函数。

例:设某车间用一台包装机包装葡萄糖,包得的袋装糖重量是一个随机数,它服从正态分布。当机器正常时,其均值为0. 5公斤,标准差为0 例:设某车间用一台包装机包装葡萄糖,包得的袋装糖重量是一个随机数,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015。某日开工后检验包装机是否正常,随机地抽取它所包装的的糖9袋,称得净重为(公斤)0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512,问机器是否正常? 解: (分析)总体均值、标准差已知,则可设样本的标准差为0.015,于是 问题就化为根据样本值来判断 还是 。为此提出假设:

>> x=[0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512]; >> [H,p,ci]=ztest(x,0.5,0.015,0.05) H = 1 p = 0.0248 %样本观察值的概率 ci = 0.5014 0.5210 %置信区间,均值0.5在此区间之外 结果H=1,说明在0.05的水平下,拒绝原假设,即认为这天包装机工作不正常。

例:某种电子元件的寿命X(以小时计)服从正态分布,均值、方差均未知。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 262 168 250 149 260 485 170 , 问是否有理由认为元件的平均寿命大于225(小时): 解:按题意需做如下假设: 取

>> x=[159 280 101 212 224 379 179 264 222 262 168 250 149 260 485 170]; >> [H,p,ci]=ttest(x,225,0.05) H = p = 0.6677 ci = 185.3622 285.1378 %均值225在该置信区间内 结果表明,H=0,即在显著水平为0.05的情况下,不能拒绝原假设。即认为元件的平均寿命不大于225小时。

8.4.2 正态分布假设检验 由随机样本判定分布是否为正态分布,可用下面两个假设算法的函数。 s为接受假设的概率值,s越接近于0,则可以拒绝是正态分布的原假设.

>> [H,p]=jbtest(X,0.05) %P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设; H = 例: >> X=[216,203,197,208,206,209,206,208,202,203,206,213,218,207,208,... 202,194,203,213,211,193,213,208,208,204,206,204,206,208,209,... 213,203,206,207,196,201,208,207,213,208,210,208,211,211,214,... 220,211,203,216,224,211,209,218,214,219,211,208,221,211,218,... 218,190,219,211,208,199,214,207,207,214,206,217,214,201,212,... 213,211,212,216,206,210,216,204,221,208,209,214,214,199,204,... 211,201,216,211,209,208,209,202,211,207,202,205,206,216,206,... 213,206,207,200,198,200,202,203,208,216,206,222,213,209,219]; >> [H,p]=jbtest(X,0.05) %P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设; H = p = 0.7281

>> [mu1,sig1,mu_ci,sig_ci]=normfit(X,0.05); mu=[mu1,mu_ci'] 208.8167 207.6737 209.9596 %该分布的均值及置信区间 >> sig=[sig1, sig_ci'] sig = 6.3232 5.6118 7.2428 %该分布的方差及置信区间

%P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设;c为测试统计量的值,d为是否拒绝原假设的临界值,c>d, 故拒绝。 例: >> r=gamrnd(1,3,400,1); [H,p,c,d]=jbtest(r,0.05) H = 1 p = c = 504.2641 d = 5.9915 %P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设;c为测试统计量的值,d为是否拒绝原假设的临界值,c>d, 故拒绝。

8.4.3 其它分布的Kolmogorov-Smirnov 检验 其中cdffun为两列的值,第一列为自变量,第二列为对应的分布函数的值。

例: >> r=gamrnd(1,3,400,1); alam=gamfit(r) alam = 0.9708 3.1513 检验: >> r=sort(r); >> [H0,p]=kstest(r,[r gamcdf(r,alam(1),alam(2))],0.05) H0 = p = 0.6067

8.5方差分析及计算机求解 8.5.1 单因子方差分析 对一些观察来说,只有一个外界因素可能对观测的现象产生影响。 8.5方差分析及计算机求解 8.5.1 单因子方差分析 对一些观察来说,只有一个外界因素可能对观测的现象产生影响。 单因素方差分析是比较两组或多组数据的均值,它返回原假设—均值相等的概率,若p值接近于0,则原假设受到怀疑,说明至少有一列均值与其余列均值有明显不同。 X为需要分析的数据,每一列对应于随机分配的一个组的测试数据,这样会返回概率p,tab为方差分析表 。stats为统计结果量,为结构变量,包括每组均值等。

单因子方差分析表

例:

建立A矩阵,并求各列的均值。 >> A=[5,4,6,7,9; 8,6,4,4,3; 7,6,4,6,5; 7,3,5,6,7; 10,5,4,3,7; 8,6,3,5,6]; >> mean(A) ans = 7.5000 5.0000 4.3333 5.1667 6.1667 >> [p,tbl,stats]=anova1(A) %单因子方差分析 p = 0.0136 %<0.02或0.05,应拒绝给出的假设,有影响。 tbl = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [36.4667] [ 4] [9.1167] [3.8960] [0.0136] 'Error' [58.5000] [25] [2.3400] [] [] 'Total' [94.9667] [29] [] [] []

stats = gnames: [5x1 char] n: [6 6 6 6 6] source: 'anova1' means: [7.5000 5 4.3333 5.1667 6.1667] df: 25 s: 1.5297 单因子方差表 盒式图

例:设有3台机器,用来生产规格相同的铝合金薄板。取样测量薄板的厚度,精确至‰厘米。得结果如下: 机器1:0.236 0.238 0.248 0.245 0.243 机器2:0.257 0.253 0.255 0.254 0.261 机器3:0.258 0.264 0.259 0.267 0.262 检验各台机器所生产的薄板的厚度有无显著的差异? >> X=[0.236 0.238 0.248 0.245 0.243; 0.257 0.253 0.255 0.254 0.261 ;0.258 0.264 0.259 0.267 0.262]; >> P=anova1(X') P = 1.3431e-005

8.5.2 双因子方差分析 如果有两种因子可能影响到某现象的统计规律,则应该引入双因子方差分析的概念。这时观察值可表示为一个三维数组。 根据双因子的特点,可以引入3个假设

双因素方差表

表中记号的定义 求解双因子方差分析问题:

例:比较 3 种松树在4 个不同地区的生长情况有无差别,在每个地区对每种松树随机地选择 5 株,测量它们的胸径,对它们进行双因子方差分析。

>> anova2(B‘,5); %5表示每一单元观察点的数目 28,22,25,19,26,30,26,26,20,28,19,24,19,25,29,17,21,18,26,23; 18,10,12,22,13,15,21,22,14,12,23,25,19,13,22,16,12,23,22,19]; >> anova2(B‘,5); %5表示每一单元观察点的数目 小, 很大,所以没有理由拒绝另外两个假设。故得出结论:地区对树的胸径无显著影响,不同区域对不同树种的胸径观测结果也无显著影响。

计算均值: >> C=[]; >> for i=1:3 for j=1:4 C(i,j)=mean(B(i,[1:5]+(j-1)*5)); end, end >> C=[C; mean(C)]; C=[C mean(C')'] C = 19.6000 20.0000 21.0000 18.8000 19.8500 24.0000 26.0000 23.2000 21.0000 23.5500 15.0000 16.8000 20.4000 18.4000 17.6500 19.5333 20.9333 21.5333 19.4000 20.3500

8.5.3 多因子方差分析

>> syms x y=dsolve('D2y-(2-1/x)*Dy+(1-1/x)*y=x^2*exp(-5*x)',... 'y(1)=pi','y(pi)=1','x') >> vpa(y,10) ans = .7716049383e-3*exp(-5.*x)*(6.*ei(1,6.*x)*exp(6.*x)+11.+30.*x+36.*x^2)+1.155578411*exp(x)-.9717266135*log(x)*exp(x) >> x1=0.5:0.01:4; y1=subs(y,x,x1); >> plot(x1,y1,1,pi,'o',pi,1,'o')