非线性拟合 --捕食和功能响应曲线 张海成 李希希 张艳聪.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
Chapter 15 複迴歸.
第十章 相关与回归分析 PowerPoint 统计学.
回归分析法预测 (Regression Analysis)
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
预测与决策分析 Forecasting and Decision Analysis
常用逻辑用语复习课 李娟.
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
计量经济学 第三章 多元线性回归模型.
第15章 相关分析与回归分析 (续).
Chapter 2 簡單迴歸模型.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
Chapter 14 Simple Linear Regression
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
回归分析.
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
用统计学方法研究电商平台上的产品销售特征
第4章 Excel电子表格制作软件 4.4 函数(一).
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第三章 两变量线性回归.
第四章 多元线性回归分析.
利用SAS统计软件定位 家畜群体的QTL 报告人: 殷 宗 俊 安徽农业大学动物科技学院.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
一元二次不等式解法(1).
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
Logistic回归 Logistic regression 研究生《医学统计学》.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Volterra-Lotka方程 1925年, A. Lotka(美)和V. Volterra(意)给出了第一个两物种间的捕食模型。
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

非线性拟合 --捕食和功能响应曲线 张海成 李希希 张艳聪

主要内容 1 基本概念原理 2 生态学问题 3 统计学解答 2

一 基本概念原理 1.1 引入 1.2 一元线性回归 1.3 多元线性回归 1.4 非线性回归 张海成 3

1.1 引入 连续变量: 相关分析、回归分析 考察变量之间关系的统计方法: 自变量 连续 分类 混合 响应变量 回归分析 1.1 引入 考察变量之间关系的统计方法: 自变量 连续 分类 混合 响应变量 回归分析 方差分析(ANOVA) 协方差分析(ANCOVA) 逻辑斯蒂回归 分对数模型 逻辑斯谛回归或分对数模型 连续变量: 相关分析、回归分析 4

回归 相关 不必区分自变量与因变量 描述两变量数量上联系的密切程度 所研究变量属于对等的关系 区分自变量和因变量 自变量对因变量数量上的影响程度 所研究变量属于非对等关系 5

回归分析法: 通过实验和观测建立变量之间关系的一种数理统计方法 线性回归分析 一元回归分析 回归分析 多元回归分析 非线性回归分析 6

主要目的: 内容: 在于了解自变量对因变量影响 探索和确定变量之间的相关关系和相关程度 建立回归模型,检验变量之间的相关程度 应用回归模型进行估计和预测等 7

1.2 一元线性回归 适用条件: 无偏性: E(ε) = 0 正态性, ε 为服从正态分布的随机变量 Y因变量; x自变量;β0, β1回归系数,ε随机误差 适用条件: 无偏性: E(ε) = 0 正态性, ε 为服从正态分布的随机变量 方差齐性:各组ε的方差都相同,即 ε 与自变量、因变量之间相互独立 独立性:各组ε之间相互独立,且COV(ε i, ε j) = 0, (i ≠ j) 8

参数β0, β1 的普通最小二乘估计 基本思想:回归直线与所有样本数据点距离最近 体重—身高 9

对β0,β1分别求偏导 且令两偏导等于0 整理后得到 求解 10 求关于β0和 β1的二次函数Q(β0,β1)的极小值点即可得到β^0, β^1 的最小二乘估计。 求解 10

回归方程拟合优度的评价 拟合优度: 样本观测值聚集在样本回归线周围的紧密程度 决定系数:R² SST 总离差平方和 SSE 残差平方和 SSR 回归平方和 11

R²表示全部偏差中有百分之多少可由x和y的回归关系来解释 12

回归方程的显著性检验 1 对整个回归方程的显著性检验(F检验) 2 对各回归系数的显著性检验(t检验) 13

对整个回归方程的显著性检验 提出假设:H0:回归方程不显著(βi = 0); H1: 回归方程显著(βi不全为0) F-检验(ANOVA) 方差来源 平方和 自由度 均方 F值 回归 SSR 1 误差 SSE n-2 总计 SST n-1 ③ 给出显著性水平α,确定临界值F(1, n-2) ④ 若F ≥ Fα (1, n-2), 拒绝H0,说明回归方程总体显著;反之 14

对回归系数的显著性检验 提出建设:H0: 回归系数不显著(β1 = 0 ); H1:回归系数显著(β1 ≠0) t-检验 S1:回归系数 的标准差 Syx, σ: 估计标准误差 σ²: 误差项方差 ③ 给定显著性水平α,确定临界值tα/2(n-2) ④ 若 |t|≥ tα/2(n-2), 则拒绝H0,认为回归系数显著;反之 15

2)斜率a,截距b使用其他复杂统计量,SPSS以协方差分析进行检验(见ANCOVA-63) 两条或多条回归方程的差异性比较 例:1)A,B两样地观测数据得到的回归方程是否有显著性差异 2)男、女生身高与体重的回归方程是否有显著性差异 Y = a1X + b1 + ε1 Y = a2X + b2 + ε2 … Y = anX + bn + εn 原理: 检验斜率、残差、截距三项 1)残差ε : F-检验 2)斜率a,截距b使用其他复杂统计量,SPSS以协方差分析进行检验(见ANCOVA-63)

SPSS具体处理步骤: 多用协方差分析检验截距和斜率的差异,以SPSS为例:1.先重新整理数据,将y2数据列加到y1下面,变成一个变量y;将x2数据列加到x1下面,变成一个变量x;然后再设定一个新的分组变量group,原来第1组值为1,第2组值为2.  2.进行协方差分析(第一步分析斜率是否无差异).  Analyze->General Linear Model->Univariate  Dependent List:填入y---------将y做为因变量  Fixed Factor:填入group  Covaraites:填入x--------将x做为协变量  Model:选Custom  Model:填入 x group x*group---------注意如果变量填入顺序不一样,结果也会不一样. (注意:x*group是通过双选得到) Sum of squares下拉列表框:选TypeI  然后点击ok,看结果里x*group这一行的Sig.P值,若大于0.05,则接受原假设,即两条回归直线的斜率无差异,否则拒绝.  3.再来进行截距的无差异分析  其实过程跟上面一样,只是Model里去掉了x*group交叉项.  Analyze->General Linear Model->Univariate  Dependent List:填入y---------将y做为因变量  Fixed Factor:填入group  Covaraites:填入x--------将x做为协变量  Model:选Custom  Model:填入 x group ---------注意如果变量填入顺序不一样,结果也会不一样.  Sum of squares下拉列表框:选TypeI  点击ok后,看group一行的Sig.P值,若P值大于0.05说明两条回归直线截距也无差异,若小于0.05说明截距是有差异的.  PS:paired test是student-t检验的一种,但检验的结论是两组数据所来源总体的差异。所以判断两回归曲线的差异,需用协方差分析或单独的检验统计两来判断截距和斜率的差异。

回归方程的估计与预测 点估计 回归方程估计 置信区间估计 19

回归方程的估计与预测 对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值的预测值。 点估计 20

回归方程的估计与预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间 置信区间估计 对于给定的 x = x0 ,Y 的1-置信区间为: 自由度为n-2的 t 分布 的  水平双侧分位数 21

回归方程的估计与预测 置信区间估计 Sy: 回归估计标准差 22

1.3 多元线性回归 适用条件: 无偏性E(ε) = 0 ε = (假定:x1,x2…xp无交互作用) ε = Y:因变量; x1, x2, … xp: 自变量; Β0, β1, … βp: 回归系数 ε :随机误差 适用条件: 无偏性E(ε) = 0 服从正态分布 方差齐性 独立性 23

多元线性回归模型的参数估计 基本思想:使估计值 与观测值y之间的残差在所有样本点上达到最小 方法:最小二乘法 (详见路径分析) Q最小 方法:最小二乘法 (详见路径分析) Q最小 步骤: 分别对β0, β1…… βp求偏导 令各偏导等于0 求得β0, β1…… βp 24

拟合优度检验 总偏差 (SST) = 回归偏差 (SSR) + 剩余偏差 (SSE) 25

回归方程显著性检验 对整个回归模型的显著性检验(似一元回归模型) ① 提出假设,H0:回归模型不显著(β1 = β2……= βp = 0);H1:回归模型显著( β1 , β2…… βp 不全为0) ② 建立F统计量 方差来源 平方和 自由度 均方和 F值 回归 SSR p 误差 SSE n-p-1 总计 SST n-1 ③ 给出显著性水平α,查F分布表,得临界值Fα (p, n-p-1) ④ F ≥ Fα (p, n-p-1), 则拒绝H0,回归模型显著 26

回归系数显著性检验 ① 提出假设: H0: βi = 0; H1:βi = 0; ② 建立t检验计算公式:③ ④ Si:回归系数标准差;Cii是(XTX)-1中第i+1个主对角线元素 ③ 给出显著性水平α,查t分布表,得临界值tα / 2 (n-p-1) ④ |t| ≥ tα / 2 (n-p-1), 则拒绝H0,回归系数显著 27

1.4 非线性回归模型 线性模型: yi 是解释变量xi 的线性函数 yi 是相应参数βi 的线性函数 28

非线性模型: 建立因变量与自变量之间的非线性关系 无假设条件,可建立任意形式的模型 本质线性模型 非线性模型 本质非线性模型 29

本质线性模型 30

B = pDq 模型的选取 了解数据特点或可辨别变量间的相关关系 ——直接选择函数模型 数据认识不充分,不能辨别变量间的相关关系 —— 绘制散点图,根据图形特点选择模型形式 对于无法直接从散点图看出应选取何种回归模型的 ——尝试多种可能的模型,并通过R²的大小、图形本身的比较选择出最优模型 B = pDq 31

函数转换法不足: 可能导致更复杂的计算 可能导致数据失真 不是所有非线性模型均可转换为线性模型 32

本质非线性模型 无法通过变量变换转化为线性模型 33

最大似然法(模型随机误差部分占优势) 非线性回归模型解法 Gauss-Newton算法 Newton-Raphson算法 最小二乘法(模型主体部分占优势) Gauss-Newton算法 Newton-Raphson算法 最大似然法(模型随机误差部分占优势) 1) 估算模型中参数的起始值及其取值范围 2) 利用迭代算法寻找使得残差平方和最小的参数估计值 Newton-Raphson算法 计数算法 BHHH算法 34

二 生态学问题 2.1 生态学问题 2.2 数学模型 李希希 35

动物生态学的基本知识 动物生态学(animal ecology):是从生物种群和群落的角度研究动物与其周围环境相互关系的科学,是生态学的分支,是由动物学与生态学等交叉形成的学科。 36

研究内容 (1)阐明动物与生存条件的关系,生存条件的变化对动物的生理结构、形态特征和行为方式的影响; (2)研究在一定的生存条件下各种动物种群的数量关系,出生率和死亡率的变化,种群密度和年龄分布; (3)研究一定的环境条件下种内和种间关系以及它们对动物进化的意义,种内与种间的合作与竞争,捕食-被捕食,种间各种共生关系,以及动物种群的结构和演化; (4)研究不同生态条件下动物种群和群落的形成、适应性和演化; (5)人类对动物资源开发利用和动物遗传资源的保护等。 37

2.1 生态学问题 自然界中有很多例子能证明捕食者具有控制其捕食猎物密度的功能。 例如:1、1950年~1960年间北美五大洲中的七鳃鳗几乎导致湖红点鲑的灭绝; 2、在人类开始捕杀狼之前,黄石地区的狼使得当地麋鹿的密度受到控制。 38

功能响应(Functional Response):一个捕食者个 体所能猎杀的猎物数量(或者一个寄生物能攻击的寄 主数量)是关于猎物密度的函数。 一定时间内被猎杀的猎物数随着猎物密度的增加 逐渐接近一个渐近线。 39

第Ⅰ类功能响应 ※捕食者随机搜寻猎物 ※搜寻时间为一常数 ※食欲有限 ※不考虑猎物被捕食者处理所 需的时间。 被捕食猎物数在一定范围内随猎物种群的增加而直线增加,超过则不再增加。 被猎杀猎物比例保持最大(非 密度依赖型),继而降低。 其中,Ne是被捕食猎物数; N是猎物密度。 40

第Ⅱ类功能响应 ※捕食者随机搜寻猎物 ※搜寻时间与处理时间成反比 ※捕食者食欲有限 捕食的猎物数随猎物密度的增加,以双曲线型接近渐近线,超过这一范围将不再增加 被猎杀猎物的比例渐进型减少(反密度依赖型)。 T 表示总时间。 Th表示每个捕食者处理每个猎物所需的时间(其中包括用于吞食猎物和无法攻击其他猎物的所有时间)。 41

第Ⅲ类功能响应 ※取食猎物的效率 ~食量限制 ~猎物种群低密度下的敏感 程度 ※猎物数与猎物种群密度为 “S”型曲线 42

研究功能响应涉及的相关问题 功能响应的类型是什么?(比较C和E、D和F) 功能响应的机制模型中系数的最佳估计是什么? 描述两种功能响应的模型中系数是否有显著的不同? 43

研究功能响应相关问题的一般方法 模型选择——包括使用对被捕杀猎物与猎物总数之 比的逻辑斯蒂回归方法 模型选择——包括使用对被捕杀猎物与猎物总数之 比的逻辑斯蒂回归方法 假设检验——包括对被杀猎物数量和所提供猎物数 量比值的非线性最小二乘回归来估计功能响应的参 数以及比较不同功能响应的参数。 44

2.2 功能响应的数学模型 Ne = a*TsN 与功能响应相关的因素 被捕食量,用Ne表示。 6. 每个捕食者处理每个猎物所需的时间(其中包 括用于吞食猎物和无法攻击其他猎物的所有时 间),用Th表示。 Ne = a*TsN 45

Ne = a*TsN Ts =T - ThNe 公式2: Ne = aNT/(1+aNTh) 将Ts考虑为一个变量,又根据: 将 代入 中,变形可得: 公式2: Ne = aNT/(1+aNTh) 46

第Ⅰ类功能响应 公式2: Ne = aNT/(1+aNTh) 当Th=0, 即不考虑猎物的处理时间时: 公式1: Ne = aNT 47

Disc方程模拟第Ⅱ类功能响应 模型假定: 1.渐近线由时限决定; 2.捕食者遇到猎物概率和猎物密度线性相关; 3.当捕食者在处理猎物时不再进行其他捕获; 4.猎物密度恒定。 48

第Ⅱ类功能响应 公式2: Ne = aNT/(1+aNTh) 被捕食量,用Ne表示。 攻击系数(瞬时的搜寻速率)使得 猎物的遇到概率和猎物密度相关联。 用a表示。 3. 猎物密度,用N表示。 4. 总时间,用T表示。 5. 每个捕食者处理每个猎物所需的时 间(其中包括用于吞食猎物和无法 攻击其他猎物的所有时间),用Th 表示。 49

存在猎物消耗时描述功能响应的适合模型 ɑ关于N的双曲线型函数 b,c和d均为常数 50

式 产生的各种形式的ɑ和N之间的关系 ɑ与N之间的关系 ɑ 假定功能响应已知是Ⅲ型;因而至少有b>0 ɑ的计算公式 无 等于零的系数 ɑ的计算公式 ɑ与N之间的关系 无 (d+bN)∕(1+cN) 增加至渐近线;截距为d,不等于零 c d+bN 线性增加;截距为d,不等于零 d bN∕(1+cN) 增加至渐近线;截距等于零 d和c bN 线性增加;截距等于零 ɑ 假定功能响应已知是Ⅲ型;因而至少有b>0 51

猎物消耗的功能响应 式 公式2 代入 公式3 52

第Ⅲ类功能响应 当a是一个N的增函数时,就会出现第Ⅲ类功能响应: 公式3 53

上述模型假定猎物密度N恒定,而实际上N往往随实验的进行而降低。当N减少时,描述功能响应的合适模型应是对公式2和3的时间积分式,从而可应对变化的猎物密度。 54

公式2: 猎物密度降低 公式4: 55

对于第Ⅲ类功能响应,当ɑ如式 中所示是初始密度的函数时为最简单的形式: 对于第Ⅲ类功能响应,当ɑ如式 中所示是初始密度的函数时为最简单的形式: 式 : 公式4: 公式5: 56

总结 1.功能响应(Functional Response):一个捕食 者个体所能猎杀的猎物数量(或者一个寄生物能攻 击的寄主数量)是关于猎物密度的函数。

实验时猎物密度N恒定 类型II 类型III 实验时猎物密度N不恒定(初始N0) 类型II 类型III a: 攻击系数 Th:处理每个猎物所需的时间 b,c,d: 决定攻击系数a 实验时猎物密度N不恒定(初始N0) 类型II 类型III a: 攻击系数 Th:处理每个猎物所需的时间 b,c,d: 决定攻击系数a 59

三 统计学解答 3.1 统计学问题解答 3.2 实例分析 张艳聪 60

研究功能响应时涉及的问题 功能响应的类型是什么?(比较C和E 或 D和F) 功能响应的机制模型中系数的最佳估计是什么? 描述两种功能响应的模型中系数是否有显著的不同? 61

3.1 统计学问题解答 62

模型选择:确定功能响应形状 3.1.1 求解过程(最大似然法) 求解过程(区分相应曲线) 3.1.2 假设检验:参数估计和比较 4 求解过程(最大似然法) 1) 求解过程(区分相应曲线) 2) 3.1.2 假设检验:参数估计和比较 方法(最小二乘法) 1) 求解过程(牛顿迭代法) 2) 63

描述离散型因变量和连续型自变量的关系的回归模型 3.1.1 模型选择:确定功能响应曲线 变量特征: 因变量Y取值:Y=1 死亡,Y=0 活着, 0-1 变量 自变量N: N0 猎物初始密度, 为连续变量 方法:被杀猎物和现有猎物比例的逻辑斯蒂回归 描述离散型因变量和连续型自变量的关系的回归模型 自变量(N) 因变量(Y) Y=1的概率 (μY·N) μY·N的Logistic 变换 连续型 N∈[0,+∞) 离散型 Y=0,1 连续型 μY·N=P(Y=1) ∈[0,1] Q∈(-∞,+∞) 64

Logistic变换关系 被捕食的概率 猎物密度 ? P=f(N) Logistic 变换 65

1)求解过程(最大似然法) 最大似然法: (1)最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。 (2)当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。 66

1)求解过程(最大似然法) Logistic回归方程: (其中a0, a1, a2 … az是需要估计的系数) 利用迭代法寻找参数数值 被捕食: 存活: (其中a0, a1, a2 … az是需要估计的系数) 利用迭代法寻找参数数值 使得似然函数L最大化 因变量Y为(0, 1)变量 67

1)求解过程(最大似然法) 例题1:假设B组每只老鼠被捕食的概率为P, 则同时出现以下10项观察值的概率L是多少? 68

1)求解过程(最大似然法) 对于给定的自变量N值,当参数a0, a1, a2, …, az 取不同的值时,L大小会发生变化,表明不同参数估计对实际结果的拟合情况。L越大,说明产生实际结果的概率越大,即与实际结果拟合得越好。 当参数a0, a1, a2, …, az 取某些特定值,使得L最大时,表明这些参数使得实际结果发生的概率最大,说明这些参数是拟合模型的最佳值。使用得到实际观测值的概率来作为拟合参数优劣标准的方法,就是最大似然估计。 69

使用Logistic回归区分II、III型功能响应 2)求解过程(区分功能曲线) 使用Logistic回归区分II、III型功能响应 Ne ~ N 难区分 70

使用Logistic回归区分II、III型功能响应 2)求解过程(区分功能曲线) 使用Logistic回归区分II、III型功能响应 P=Ne/N ~ N 容易区分 71

2)求解过程(区分功能曲线) 72

模型选择:确定功能响应形状 3.1.1 求解过程(最大似然法) 求解过程(区分相应曲线) 3.1.2 假设检验:参数估计和比较 4 4 求解过程(最大似然法) 1) 求解过程(区分相应曲线) 2) 3.1.2 假设检验:参数估计和比较 方法(最小二乘法) 1) 求解过程(牛顿迭代法) 2) 73

3.1.2 假设检验:参数估计与比较 方法:最小二乘法 寻找特定的参数使得模型预测值与观测值的离差平方和最小,以此作为拟合参数优劣的标准。 实际观测值 理论预测值 74

1)方法(最小二乘法) 实验时猎物密度N恒定 类型II 类型III a:攻击系数 Th:处理每个猎物所需的时间 b,c,d: 决定攻击系数a 实验时猎物密度N不恒定(初始N0) 类型II 类型III a: 攻击系数 Th:处理每个猎物所需的时间 b,c,d: 决定攻击系数a 75

1)方法(最小二乘法) 例子:II型曲线 (1)猎物密度N恒定 (2)猎物密度N不恒定 76

2)求解过程(牛顿迭代法) 使用牛顿迭代法求 77

78

总结比较:最小二乘法与最大似然法 最小二乘法 最大似然法 目的 拟合回归模型的参数 模型自变量(X) 连续变量 因变量(Y) 离散变量 (0-1型分布) 条件平均数 连续变量,一般 ∈[0,+∞] Y=1的概率,∈[0,1] 函数 最优标准 参数取值使得L最小 参数取值使得L最大 统计意义 参数取值使得观测值与模型预测值的离差平方和最小,即为最优参数,模型与实际最符合。 参数取值使得利用模型预测产生实际观测值的概率最大,即为最优参数,模型与实际最符合。 79

3.2 实例演示 Notonecta捕食Asellus 捕食者:Notonecta glauca 中国大仰蝽属 猎物:Asellus aquaticus 栉水虱 1)猎物密度从5,7,8…..100等11个取值; 2)每个密度至少八个重复; 3)总共有89个观测值 4)持续72h。 Q1:功能响应的曲线是那种,Ⅱ或者Ⅲ? Q2:最佳的参数估计是什么? 80

N0 = initial number of prey REP = replicate number, 原始数据如右表: N0 = initial number of prey REP = replicate number, FATE: 0 = prey eaten 1 = prey alive NE = count of prey in each FATE FATE=0时, NE:为被捕食数目,即Ne FATE=1时, NE:为活着的数目 对一个重复,N0=ΣNE 81

第一步:模型选择 (1)进行Logistic回归分析,建立回归方程 (2)根据回归方程估计相应曲线的形状 82

SAS界面 run log program output editor log 83

豆腐块 84

SAS procedure CATMOD /*对参数等于0进行最大似然检验,同时对似然比率进行检验来检验模型的整体拟合度*/ DATA NOTONECT; /* name the database*/ INPUT N0 REP FATE NE; N02=N0**2; /* initial number of prey squared */ N03=N0**3; /*initial number of prey cubed */ CARDS; /*data followed, ends with “;”*/ 85

SAS procedure CATMOD 对一个重复,N0=ΣNE PROC CATMOD DATA=NOTONECT; DIRECT N0 N02 N03; MODEL FATE = N0 N02 N03 / ML NOGLS NOPROFILE ; POPULATION N0 REP; WEIGHT NE; /*指定权重变量*/ 不使用广义最小二乘法估计 最大似然法 不显示样本值和响应值 对一个重复,N0=ΣNE 86

The result of CATMOD procedure Maximum Likelihood Analysis of Variance Source DF Chi-Square Pr > ChiSq -------------------------------------------------- Intercept 1 28.68 <.0001 N0 1 6.66 0.0098 N02 1 7.52 0.0061 N03 1 5.67 0.0172 Likelihood Ratio 85 206.82 <.0001 Analysis of Maximum Likelihood Estimates Standard Chi- Parameter Estimate Error Square Pr > ChiSq ---------------------------------------------------------- Intercept -1.3457 0.2513 28.68 <.0001 N0 0.0478 0.0185 6.66 0.0098 N02 -0.00103 0.000376 7.52 0.0061 N03 5.267E-6 2.211E-6 5.67 0.0172 所有参数显著不等于0,但是模型整体拟合不佳 一次项系数大于0,可以判断应属于III类功能相应 87

DATA NOTONEC2; /. 修正数据,去除猎物存活的数据行,添加捕食比例数据列 DATA NOTONEC2; /* 修正数据,去除猎物存活的数据行,添加捕食比例数据列*/ SET NOTONECT; IF FATE= 0; PROPEAT= NE/N0; PROC MEANS DATA=NOTONEC2; /*计算基本统计量:均值,SE等*/ BY N0 NOTSORTED; /*按照N0值分组且不排序*/ VAR PROPEAT; /*指定被食比例变量,计算该变量的均值、方差等*/ OUTPUT OUT=NOTOMEAN MEAN=MEANPROP; /*输出结果到NOTOMEAN数据集中,输出每个N0对应的均值*/ DATA NOTONEC3; /* 产生估计值数据集,包括每组N0对应的预测值*/ SET NOTOMEAN; K=EXP(-1.3457+(0.0478*N0)-(0.00103*N0**2)+(0.000005267*N0**3)); PRED=K/(1+K); PROC PLOT DATA=NOTONEC3; /*绘制平均观测值与估计值散点图 */ PLOT PRED*N0='P' MEANPROP*N0='*'/OVERLAY; 观测值 估计值 88

每个点代表在给定猎物初始密度下的被捕食概率 * : 实际观测值 P :拟合估计值 Type III Functional Response 每个点代表在给定猎物初始密度下的被捕食概率 * : 实际观测值 P :拟合估计值 89

第二步:拟合数据并估计参数 非线性最小二乘法( SAS procedure NLIN) 应用条件: (1)正态分布 (2) 方差齐性 选用存在猎物消耗的III类功能响应模型: H0:b=0 c=0 d=0 Th=0 N0: 猎物初始密度 Ne: 被食数量 T:可利用时间 Th:处理每个猎物所需时间 90

第二步:假设检验 初始值的设定: d: 许多情况下比较小,一般初值设置为0 b和c: 通常是选择覆盖两个数量级的不同初始值, 因为当攻击系数a (瞬时搜索速率)是一个N的增函数时,出现第三类功能相响应,所以参数 b>0 ,c>=0,d>=0 Th: 猎物处理时间 Th>0 N0: 猎物初始密度 Ne: 被食数量 T:可利用时间 (72h) Th:处理每个猎物所需时间 91

完整模型: PROC NLIN DATA=NOTONEC2; PARMS BHAT= 0.001 0.01 0.1 CHAT= 0.001 0.01 0.1 DHAT= 0 THHAT=3.0; BOUNDS BHAT>0,CHAT>=0, THHAT>0; T=72; X=NE; A=(DHAT+BHAT*N0)/(1+CHAT*N0); C1=EXP(-A*T); C2=A*THHAT; H=N0*C1*EXP(C2*X)+X-N0; ITER=0; 待续…… 92

完整模型: 牛顿迭代法 DO WHILE(ABS(H)>0.0001 AND ITER<50); 续上一页 DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END; MODEL NE=X; /*新的预测值Nei+1*/ /* 将Nei+1 带入函数求取f(Nei+1) */ 93

Procedure NLIN: Full model Nonlinear Least-Squares Summary Statistics Dependent Variable NE Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 3 9526.8 3175.6 157.57 <.0001 Error 86 1733.2 20.1535 Uncorrected Total 89 11260.0 Approx Approximate 95% Parameter Estimate Std Error Confidence Limits Label BHAT 0.000416 0.000228 -0.00004 0.000869 CHAT 0 0 0 0 DHAT 0.000832 0.00382 -0.00676 0.00842 THHAT 4.0640 0.3575 3.3534 4.7747 Bound0 107.9 315.6 -509.1 725.0 0 <= CHAT 94

简化模型1: PROC NLIN DATA=NOTONEC2; PARMS BHAT=0.001 0.01 0.1 DHAT=0 THHAT=3.0; BOUNDS BHAT>0,THHAT>0; T=72; X=NE; A=(DHAT+BHAT*N0); C1=EXP(-A*T); C2=A*THHAT; H=N0*C1*EXP(C2*X)+X-N0; ITER=0; 待续…… 95

简化模型1: DO WHILE(ABS(H)>0.0001 AND ITER<50); 续上一页 DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END; MODEL NE=X; 牛顿迭代法 96

Procedure NLIN: Reduced model 1 Nonlinear Least-Squares Summary Statistics Dependent Variable NE Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 3 9526.8 3175.6 157.57 <.0001 Error 86 1733.2 20.1535 Uncorrected Total 89 11260.0 Approx Parameter Estimate Std Error Approximate 95% Confidence Limits BHAT 0.000416 0.000228 -0.00004 0.000869 DHAT 0.000831 0.00382 -0.00676 0.00842 THHAT 4.0641 0.3575 3.3534 4.7747 97

简化模型2: PROC NLIN DATA=NOTONEC2; PARMS BHAT= 0.001 0.01 0.1 THHAT= 3.0; BOUNDS BHAT>0,THH>0; T=72; X=NE; A=BHAT*N0; C1=EXP(-A*T); C2=A*THHAT; H=N0*C1*EXP(C2*X)+X-N0; ITER=0; 待续…… 98

简化模型2: DO WHILE(ABS(H)>0.0001 AND ITER<50); 续上一页 DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END; MODEL NE=X; 牛顿迭代法 99

Procedure NLIN: Reduced model 2 Nonlinear Least-Squares Summary Statistics Dependent Variable NE Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 2 9525.8 4762.9 238.93 <.0001 Error 87 1734.2 19.9338 Uncorrected Total 89 11260.0 Approx Parameter Estimate Std Error Approximate 95% Confidence Limits BHAT 0.000460 0.000104 0.000254 0.000666 THHAT 4.1043 0.2892 3.5294 4.6792 100

小结 线性回归 非线性回归 回归分析 捕食和功能响应 确定功能 响应类型 功能响应参数 的估计和比较 Logistic回归 非线性最小二乘法 统计方法: 应用 捕食和功能响应 生态学问题: 确定功能 响应类型 功能响应参数 的估计和比较 Logistic回归 非线性最小二乘法 101

作业 102

(1) 求胸径(D)和材积(V)的最佳回归关系(取线性、幂、指数、对数方程中最优的) A林场有100公顷落叶松林地,林分密度为1000棵/公顷,整个林地落叶松的平均胸径D=10cm,现随机伐取30棵落叶松样本,测得各样本胸径(D)及材积(V)的数据如下表, (1) 求胸径(D)和材积(V)的最佳回归关系(取线性、幂、指数、对数方程中最优的) (2) 求置信度α=0.05,D=10cm时的点估计,置信区间估计 (提示:可先转化为线性,tα/2(28)=2.048) (3)落叶松价格为800元/m3, 求当前A林场落叶松总经济价值。 样本N 胸径D(cm) 材积V(m3) 1 8.3 0.0300 16 8.5 0.0388 2 6.7 0.0133 17 3.8 0.0035 3 4.2 18 10.2 0.0703 4 9 0.0333 19 3.4 0.0008 5 8.6 0.0390 20 13.4 0.1388 6 8.1 0.0233 21 7.9 0.0368 7 4.5 22 10.8 0.0708 8 6.8 0.0115 23 0.0105 4.8 0.0043 24 13.8 0.1550 10 0.0278 25 6.1 0.0200 11 26 11.9 0.1055 12 9.4 0.0463 27 8.9 0.0400 13 6.6 0.0183 28 5.2 0.0113 14 3.9 0.0048 29 10.6 15 9.9 0.0515 30 11.2 0.0925 103

猎物消耗的功能响应 II类功能曲线 攻击系数 代入 III类功能曲线 ɑ与N之间的关系 ɑ的计算公式 无 (d+bN)∕(1+cN) c 等于零的系数 ɑ的计算公式 ɑ与N之间的关系 无 (d+bN)∕(1+cN) 增加至渐近线;截距为d,不等于零 c d+bN 线性增加;截距为d,不等于零 d bN∕(1+cN) 增加至渐近线;截距等于零 d和c bN 线性增加;截距等于零 攻击系数 代入 III类功能曲线 104