矿床统计预测基础 阶 段 小 结.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
热烈欢迎广大同学选修 《矿床统计预测》.
§3.4 空间直线的方程.
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
3.4 空间直线的方程.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
Exam 2考试知识点思维导图.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
《高等数学》(理学) 常数项级数的概念 袁安锋
第七章 固定资产 本章结构 固定资产的性质与分类 固定资产的增加 固定资产的折旧 固定资产的修理 固定资产的减少
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
2.1.2 空间中直线与直线 之间的位置关系.
第七章 参数估计 7.3 参数的区间估计.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
实数与向量的积.
顺序表的删除.
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
用计算器开方.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
直线和圆的位置关系 ·.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
《工程制图基础》 第五讲 投影变换.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
概率论与数理统计B.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
正弦函数的性质与图像.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
本底对汞原子第一激发能测量的影响 钱振宇
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
Sssss.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

矿床统计预测基础 阶 段 小 结

通过成矿预测只可提供资源量,不能获得储量! 一、矿床统计预测的基本概念、任务和分类 矿产资源:在地壳内部或地表、通过各种地质作用形成的矿物堆积体,在现在或将来的技术经济条件下可能成为有经济价值的开采对象。具有地质属性和经济属性两重性。 矿产资源总量:一个地区内全部已发现和未发现的资源量。(=矿产资源潜力+储量) 矿产资源潜力:一个地区内尚未发现的资源量。 储量:通过地质研究和工程揭露、在现行技术经济条件下具有开采价值的有用矿产资源。具有地质可性度和技术经济可行性两重性。 通过成矿预测只可提供资源量,不能获得储量!

矿床统计预测分类 矿产资源总量估计和潜力评价 成矿远景区定量预测 矿床及矿体的定位定量预测 根据预测目的、范围、比例尺、内容、方法及成果表达形式,分为三种类型: 矿产资源总量估计和潜力评价 成矿远景区定量预测 矿床及矿体的定位定量预测

找矿远景区:通过矿产资源定量预测所圈定的找矿有利地段。根据预测比例尺的不同可分为: 预测区:中小比例尺预测(<1:10万, <200km2) -估计资源潜力 找矿有利地段:中大比例尺(5万-2.5万, <20km2)-估计找矿概率 找矿靶区:大比例尺(>2.5万, <2km2) -为工程验证提供选区依据

矿床统计预测的基本任务(四定) (1)圈定成矿远景区,预测出矿床可能产出的位置; (2)预测成矿远景区中某种矿床可能存在的概率大小; (3)预测矿床值的可能大小; (4)定量评价各种控矿因素和找矿标志及其不同状态和 组合的控矿作用。

矿床统计预测基本特点 1、概率论和数理统计是矿床统计预测的重要基础和手段。 2、相似-类比原则是矿床统计预测工作的基本思路:模型单元和未知单元的定量类比。 3、矿床统计预测是一项在不确定条件下的统计决策工作,预测结果是具有一定成功概率的随机事件,在预测结果基础上的进一步勘查工作具有较大的风险性。

二、矿床统计预测基本理论 1. 相似-类比理论(Analogue) (1)在相似的成矿地质条件下,应该有相似的矿床或成矿系列产出。或者说,矿床类型相似,成矿条件和控矿地质标志组合相似。 (2)在相同的、足够大的区域内,应该有相似的矿产资源量。 (3)相似类型的矿床及其最佳控矿地质标志组合,具有相似的数学特征。

相似类比理论对矿床统计预测的指导作用 根据相似-类比理论,我们可以从已知矿床(单元)出发,建立矿床的成矿和找矿模型,筛选出有效、重要的控矿因素和找矿标志,进而选择合适的数学模型对未知矿床(单元)进行预测,圈定出有找矿远景的区域。

基于相似类比理论成矿预测的不足 根据已知的矿床模型不能预测迄今未曾发现过的新类型矿床。 根据已知矿床模型不能预测比已知矿床规模更大的超大型矿床,因为这种超大型矿床往往产生于独特的成矿地质环境之中、具有超常的成矿物质来源和聚集条件。 忽略了成矿环境、成矿过程、成矿条件和找矿标志的特殊性

2. 求异理论 在矿床统计预测及找矿实践中,不能只注意与已知矿床类型的成矿环境的类比,因为这种类比只能预测出矿床模型所描述的矿床,而不能预测出新类型和超大型矿床,故在类比的同时,还要注意求异。重视发现和圈定研究区的地质异常,并对各种地质异常进行综合评价,分析异常中对成矿有利的局部异常,区分异常的含矿性。

地质异常(Geological Anomaly) :在物质组成、结构、构造或成因上与周围环境有显著差异的地质体或地质体组合(赵鹏大等1991). 根据地质异常的尺度和规模,可以划分为: 全球地质异常 (global geological anomaly) 区域地质异常 (regional geological anomaly) 局部地质异常 (local geological anomaly) 显微地质异常 (microscopic geological anomaly) 根据地质异常与成矿或找矿的关系可以划分为: 无矿地质异常(Barren geological anomaly) 致矿地质异常 (Ore-controlling geological anomaly) 矿致地质异常 (Ore-indicating geological anomaly)

建立起矿床值(成矿有利度)与各种致矿地质异常、物探异常、化探异常、遥感异常之间的数学关系,并根据某一阈值圈定出成矿远景区(靶区) 地质异常研究内容 地质异常成因及时空演化 不同地质异常的时空联系 地质异常与成矿关系 地质异常成矿有利度计算 建立起矿床值(成矿有利度)与各种致矿地质异常、物探异常、化探异常、遥感异常之间的数学关系,并根据某一阈值圈定出成矿远景区(靶区)

3、控矿因素定量组合控矿理论 矿床的形成并非受单一地质因素控制,也非任意几个因素的简单拼凑;而是由若干个因素有机耦合并通过一定的数量关系合理搭配的结果,这种合理搭配就是成矿的充要条件。为此,要深入分析这些控矿因素的定量组合。 控矿因素定量组合分析要求不仅要系统分析成矿地质条件和找矿标志,而且要在其中找出必要的、根本的控矿因素,并分析和评价各个因素所起作用的大小、性质和方向,研究其在成矿过程中的参与程度与合理“剂量”。

控矿因素定量组合研究的内容: 1)查明各种因素在成矿中所起作用的方向、性质和大小(有利、不利、无影响 )。如接触带、断裂等在不同条件下其控矿作用是不同的。 2)研究各种控矿因素在成矿作用中的参与程度和剂量大小(有利区间)。如矿床与主断裂的距离、断裂的发育程度。 3)查明与预测工作相对应的控矿因素定量组合。这是建立矿床统计预测数学模型的重要基础。

4、“三联式”成矿预测理论 “三联式”成矿预测以各类致矿地质异常圈定为基础、以成矿多样性分析和成矿谱系研究为依据,将地质异常、成矿多样性和矿床谱系研究紧密结合,并用于指导矿产资源定量预测(赵鹏大等;2002)。

可以用多样性强度、多样性强度指数、偏多样性强度指数、资源利用率等参数来定量表征成矿多样性。如多样性强度指数: ID = ni/nmax ni-第i单元单位面积和单位剖面长度内矿种或矿产组合类型数; nmax-研究区单位面积或单位长度最大矿种或矿产组合数。 成矿多样性:由于成矿条件和致矿地质异常及其组合的多样性和复杂性,一个地区的成矿通常会表现为多样性。它是评价一个地区含矿丰度、成矿有利度和矿产资源潜力的重要指标,也是地质变量选取和预测单元划分的基础。

矿床谱系:矿床谱系是成矿多样性的某种规律性表现,包括时间谱系和空间谱系。 在同一成矿时期,矿床可以形成于不同空间部位;反之,也可以在同一空间部位有不同时期形成的矿床迭加或改造。但更多是不同时期形成的矿床产于不同的空间部位。因此,在一个地区进行成矿预测及评价时,需要分析它们的时间、空间和成因序列、建立矿床的时间谱系、空间谱系及成因谱系。 查明矿床的时空谱系对于大比例尺成矿预测具有重要指导意义。

三、 矿床统计预测一般步骤

四、地质数据预处理及其统计分布特征

地质数据可用p个地质变量的观测矩阵来表示 (i=1,2,…,n; j=1,2,…,p)

地质数据的特点 大多数地质数据是区域性变化因素、局部空间变化因素和偶然性因素综合影响的结果,即:xi=ai+bi+ri 很多地质数据是由定性资料转化而成的,用0,1或-1,0,1等二态和三态数据表示。 地质数据是通过抽样观测取得的,用它来代表总体特征必然会产生误差。 地质数据的质量和精度对成矿预测的可靠性和不确定性由重要影响

地质数据 地球化学数据 定性数据 地球物理数据 定量数据 遥感影像数据 地质数据的多总体性:矿床等地质体是漫长地质历史时期、经过多次地质作用形成的,因而通过对其进行取样获得的观测数据往往具有多总体性,其概率密度函数往往表现为双峰甚至多峰分布,又称为混合总体。 地质数据的条件性:指单个样品的体积或重量的变化可导致样本观测值分布特征的不同。所以在取样分析时,一定要考虑取样方法、位置、密度、样品大小和分析方法等。

地质数据的预处理目的: 去除或减小观测数据中所包括的随机干扰(噪音) 突出有用信息 提高数据的可利用程度 增强构置地质变量的可靠性

地质(物化探)数据预处理的内容: 数据的校正:环境、地形校正等 数据的统计分布特征研究和混合总体筛分 可疑观测值的剔除、奇异值的稳健处理 数据分布均匀化:缺失数据、过密数据 不同时间、技术条件下所获得不同水平资料的分析处理等。

地质上几种重要的概率分布模型 1、正态分布(normal distribution) 地质学中最重要、最常见的分布,其概率密度函数为: 当μ=0,σ=1时, 以上密度函数简化为:

作为总体特征值的参数,事先是未知的,它们只能分别由样本的相应特征值来代替,这种由样本导出的特征值称之为统计量。 正态分布的概率密度函数或分布函数由总体的平均值μ和标准差唯一确定: 这种描述总体分布特征的特征值称为参数,因此正态分布记为:X~N(μ, σ) ,标准正态分布X~N(0, 1) . 作为总体特征值的参数,事先是未知的,它们只能分别由样本的相应特征值来代替,这种由样本导出的特征值称之为统计量。

f(x)在( -∞, μ )区间单调上升,在x=μ处达到 极大值,在( μ , +∞ )区间单调下降。 x→±∞时,f (x) →0 以直线x=μ为轴呈对称分布 ,

正态分布的概率分布函数为:

正态分布的概率分布函数 分布函数F (x)具有以下特点: F (-∞)=0,F(+∞)=1,F(μ)=0.5 显然P(x1≤X≤x2)=F(x2)-F(x1)

在实际工作中,常常需要求出随机变量X取值落在某一区间(x1, x2)的概率即:

通过查正态分布概率密度函数表或分布函数表,并经过一些简单的计算,可以得到随机变量X: 落在(μ-σ,μ+σ)区间的概率为68.3% 落在(μ-2σ,μ+2σ)区间的概率为95.4% 落在(μ-3σ,μ+3σ)区间的概率为99.7% 落在(μ-0.67σ,μ+0.67σ)区间的概率为50% 落在(μ-1.96σ,μ+1.96σ)区间的概率为95%

混合分布和混合总体筛分 (1)定义 由一次地质作用形成的单一成因总体所构成的统计分布称为简单分布,如正态分布和泊松分布。其概率密度函数曲线是单峰曲线(unimodal)。相反,由多次地质作用叠加形成的多个成因总体所构成的统计分布称为混合分布,其概率分布曲线一般为双峰(bimodal)或多峰(polymodal)分布。 混合总体既然是多个成因总体叠加的产物,其分布一定包含有丰富的地质成因信息;因此,研究混合总体的分布具有重要的理论意义和实用价值。

(2)混合总体的筛分 从两个或两个以上的混合总体中确定出单一成因总体并对其进行参数估计的过程称为混合总体的筛分。通常在正态概率格纸上进行。

标准差相同、平均值不同的正态总体在正态概率格纸上为一组平行直线。平均数相同、标准差不同的正态总体在正态概率格纸上为相交于累积概率为50%的线上的某一点的一簇直线,而斜率各不相同。若在正态概率格纸上以概率为纵坐标,则标准差越大,直线的斜率越小。

如果数据在概率格纸上不呈直线,而是表现为一条具有拐点的曲线,则说明这批数据中有两个(以上)的总体存在,即混合总体 混合总体由A、B两个单一总体以某个比例混合而成: PA+B=fAPA+fBPB PA、PB-A、B两总体的累积概率 fA&fB-A、B两总体在混合 总体中所占的比例,fA+fB=1

混合总体的筛分 从两个(以上)的混合总体中确定出单一成因总体并对其进行参数估计的过程称为混合总体的筛分。

步 骤 1: 对原始数据进行排序、分组,计算每一组的频数、频率和累积频率,绘制数据分布直方图和频数分布曲线。

步 骤 2: 以全铁品位为横坐标、累积概率为纵坐标,在正态概率格纸上绘出实测累积频率分布曲线(每组的组中值和累积频率确定一个点;尽量使曲线连接光滑) 步 骤 3: 确定实测曲线的拐点以大致估计各成分总体在混合总体中所占比例。

步 骤 4: 根据拐点上部和下部的若干个点(尽量不要靠近拐点)的概率分别计算两个成分总体(A、B)所占的比例。 PA=PA+B/fA 对曲线下部分的总体,有: PB= (PA+B - fA) / fB

步 骤 5: 筛分、检验。 通过拐点附近若干个点作垂线分别与A、B总体相交,分别读出相应的PA, PB, PA+B,再根据PA+B=PAfA+PBfB,若计算的PA+B与实测值相差很小,说明筛分成功。 步 骤 6: 对单一正态总体进行参数估计和地质解释。

五、矿床统计预测中的地质变量研究

一、地质变量主要类型 1.观测变量(Observational variable) 对各种地质体、地质现象或地质过程可进行直接观察、测量、分析而获得原始观测数据的变量。如品位、元素丰度、矿体走向、倾角、岩体顶面标高等。

2.乘积变量(product variable) 由若干个观测变量的乘积(包括商)构成的新变量,如品位×厚度、K2O/Na2O、Co/Ni、Rb/Sr等。 两种/多种变量的组合往往可以提供更隐蔽、更重要的深层次成因信息。 Co/Ni比值可反映成矿物质以壳源或幔源为主 Fe/Mn比值反映红土型风化壳的成熟度及有关次生氧化矿床的品质。

3.综合变量(integrated variable) 将若干个独立的地质变量进行数学上的综合,构成一个新的具有特定地质意义的变量称综合变量。 如:某金矿体的前缘晕指示元素为Hg、Sb、As和Tl,而尾晕的指示元素为Cu、Pb、Zn。由于单个元素的含量变化较大,难以表示原生晕的性质和组成。这时,用多个元素的组合V1=Hg+Sb+As+Tl,V2=Cu+Pb+Zn,或比值(V1/V2)则能较有效地指示矿体可能存在的空间位置。 因子分析中的因子实际上也是综合变量,如 F1=c11Au+c12Ag+c13Bi+c14Te F2=c21Au+c22Ag+c23Zn+c24Pb 代表两个成矿阶段。

4.伪变量(virtual variable) 为了计算方便而人为附加的一个变量,又称虚拟变量。它的加入不影响计算结果。 例如在回归分析中求回归系数时,常在原始数据矩阵或相关矩阵中加上一行或一列取值为1的伪变量,使计算更为简化和方便。

地质变量的选择: (1)先多后少 (2)选取与研究对象、地质问题或研究目的密切相关的变量 工作初期尽可能地多选变量,避免漏掉有用信息,然后再进行变量的筛选、组合。 (2)选取与研究对象、地质问题或研究目的密切相关的变量 例如,当我们对某地区的斑岩铜矿进行预测时,首先应把选取变量的空间范围限定在斑岩体及附近,选取有关的岩浆岩标志、断裂裂隙系统标志、矿化分带标志、蚀变岩标志、矿物组合标志、地球化学原生晕标志、重力和电法异常等地球物理标志。

(3)注意横向可比性和纵向推断性 前者是指在已知区(模型区)选取的地质变量可以外推到未知区(预测区的类比),以保证建立的预测模型应用于研究区的效果。为此需要尽可能选取变异性较小的变量。 后者是指某些能反映深部地质和隐伏矿化特征的变量应设法加以提取,如低缓磁异常对深部铁矿床预测具有重要意义。

(4)尺度对等原则 变量选取的尺度要与预测比例尺、预测目标和任务相当。 (5)地质研究与数学分析相结合

地质变量选取的方法 1几何作图法,如点图法; 2计算简单相关系数、偏相关系数、秩相关系数; 3信息量计算法; 4秩和检验法; 5用于二态变量选择的地质向量长度分析法、相关系数比值法、变异序列法; 6各种多元统计方法,如主成分分析法、各种序贯分析法、包括全部可能回归法、逐步回归、逐步判别、序贯判别。

信息量计算法 信息量用以表征某种地质因素或标志与研究对象(矿床)的相关性,可以通过条件概率来计算。 IAj→B=A标志(如断裂)j状态(如NE向,张性)存在时B事件发生的信息量,实际工作中,由于P (B)一般不容易确定,但根据概率乘法原理,上式可变换为:

具体运算时,总体概率用样本频率来估计

计算出各标志状态的信息量后,将所有标志状态的IAj→B按大小顺序排列,计算正信息量总和 。给定有用信息水平k(一般0 计算出各标志状态的信息量后,将所有标志状态的IAj→B按大小顺序排列,计算正信息量总和 。给定有用信息水平k(一般0.75),计算有用信息△I += (n为具正信息量的标志状态数),将各标志状态的信息量由大到小进行累积,累积到△I +时的前p个地质标志状态就是我们所要选取的有利地质因素(变量)。

三、地质变量的取值 1.定量变量的取值:直接观测、测试等。 2.定性变量的取值:在进行数学处理和统计分析之前,必须对定性变量以某种方式进行赋值。 (1)按1,0或-1,0,1的方式直接赋值

某矿床的矿体一般分布在距花岗岩体150-400m范围内,这时,“距花岗岩体距离”这一变量取值可有两种状态,

(2)按统计、计算结果赋值 利用某些统计分析方法,如地质特征向量长度分析法、信息量计算及条件概率法等,对定性变量与矿床的关系进行统计分析,得到表征定性变量控矿作用程度的具体数值(如有利成矿断层的产状)。 (3)多个定性变量经统计计算后的综合赋值。 如用因子得分表示某个矿化阶段的矿化程度 F1=c11Au+c12Ag+c13Bi+c14Te F2=c21Au+c22Ag+c23Zn+c24Pb

地质变量的取值和综合变量的构置 地质变量的取值 室内取值 野外取值 地质矿产图件 物化探异常图件 遥感解释图件 各种主要控矿地质因素研究的专题图件 室内取值 是在充分研究控矿地质条件和找矿标志基础上,设计制定“预测找矿信息卡片”按网格单元或矿化异常单元逐个进行野外填写。 野外取值

地质变量的变换 使地质变量尽可能呈正态分布; 统一地质变量的数据水平; 使两变量间的非线性关系变换为线性关系; 用一组新的为数更少的相互独立变量代替一组有相关联系的原始地质变量。

标准化变换 极差化变换 均匀化变换 统一量纲/统一数据水平 对数变换 平方根变换 反余弦或反正弦变换 偏态分布→正态分布 化直变换 (双曲线、幂函数、 、指数函数、对数函数等) 非线性→线性 R型主成分分析 使原始变量的个数减少且互相独立