矿床统计预测基础 阶 段 小 结
通过成矿预测只可提供资源量,不能获得储量! 一、矿床统计预测的基本概念、任务和分类 矿产资源:在地壳内部或地表、通过各种地质作用形成的矿物堆积体,在现在或将来的技术经济条件下可能成为有经济价值的开采对象。具有地质属性和经济属性两重性。 矿产资源总量:一个地区内全部已发现和未发现的资源量。(=矿产资源潜力+储量) 矿产资源潜力:一个地区内尚未发现的资源量。 储量:通过地质研究和工程揭露、在现行技术经济条件下具有开采价值的有用矿产资源。具有地质可性度和技术经济可行性两重性。 通过成矿预测只可提供资源量,不能获得储量!
矿床统计预测分类 矿产资源总量估计和潜力评价 成矿远景区定量预测 矿床及矿体的定位定量预测 根据预测目的、范围、比例尺、内容、方法及成果表达形式,分为三种类型: 矿产资源总量估计和潜力评价 成矿远景区定量预测 矿床及矿体的定位定量预测
找矿远景区:通过矿产资源定量预测所圈定的找矿有利地段。根据预测比例尺的不同可分为: 预测区:中小比例尺预测(<1:10万, <200km2) -估计资源潜力 找矿有利地段:中大比例尺(5万-2.5万, <20km2)-估计找矿概率 找矿靶区:大比例尺(>2.5万, <2km2) -为工程验证提供选区依据
矿床统计预测的基本任务(四定) (1)圈定成矿远景区,预测出矿床可能产出的位置; (2)预测成矿远景区中某种矿床可能存在的概率大小; (3)预测矿床值的可能大小; (4)定量评价各种控矿因素和找矿标志及其不同状态和 组合的控矿作用。
矿床统计预测基本特点 1、概率论和数理统计是矿床统计预测的重要基础和手段。 2、相似-类比原则是矿床统计预测工作的基本思路:模型单元和未知单元的定量类比。 3、矿床统计预测是一项在不确定条件下的统计决策工作,预测结果是具有一定成功概率的随机事件,在预测结果基础上的进一步勘查工作具有较大的风险性。
二、矿床统计预测基本理论 1. 相似-类比理论(Analogue) (1)在相似的成矿地质条件下,应该有相似的矿床或成矿系列产出。或者说,矿床类型相似,成矿条件和控矿地质标志组合相似。 (2)在相同的、足够大的区域内,应该有相似的矿产资源量。 (3)相似类型的矿床及其最佳控矿地质标志组合,具有相似的数学特征。
相似类比理论对矿床统计预测的指导作用 根据相似-类比理论,我们可以从已知矿床(单元)出发,建立矿床的成矿和找矿模型,筛选出有效、重要的控矿因素和找矿标志,进而选择合适的数学模型对未知矿床(单元)进行预测,圈定出有找矿远景的区域。
基于相似类比理论成矿预测的不足 根据已知的矿床模型不能预测迄今未曾发现过的新类型矿床。 根据已知矿床模型不能预测比已知矿床规模更大的超大型矿床,因为这种超大型矿床往往产生于独特的成矿地质环境之中、具有超常的成矿物质来源和聚集条件。 忽略了成矿环境、成矿过程、成矿条件和找矿标志的特殊性
2. 求异理论 在矿床统计预测及找矿实践中,不能只注意与已知矿床类型的成矿环境的类比,因为这种类比只能预测出矿床模型所描述的矿床,而不能预测出新类型和超大型矿床,故在类比的同时,还要注意求异。重视发现和圈定研究区的地质异常,并对各种地质异常进行综合评价,分析异常中对成矿有利的局部异常,区分异常的含矿性。
地质异常(Geological Anomaly) :在物质组成、结构、构造或成因上与周围环境有显著差异的地质体或地质体组合(赵鹏大等1991). 根据地质异常的尺度和规模,可以划分为: 全球地质异常 (global geological anomaly) 区域地质异常 (regional geological anomaly) 局部地质异常 (local geological anomaly) 显微地质异常 (microscopic geological anomaly) 根据地质异常与成矿或找矿的关系可以划分为: 无矿地质异常(Barren geological anomaly) 致矿地质异常 (Ore-controlling geological anomaly) 矿致地质异常 (Ore-indicating geological anomaly)
建立起矿床值(成矿有利度)与各种致矿地质异常、物探异常、化探异常、遥感异常之间的数学关系,并根据某一阈值圈定出成矿远景区(靶区) 地质异常研究内容 地质异常成因及时空演化 不同地质异常的时空联系 地质异常与成矿关系 地质异常成矿有利度计算 建立起矿床值(成矿有利度)与各种致矿地质异常、物探异常、化探异常、遥感异常之间的数学关系,并根据某一阈值圈定出成矿远景区(靶区)
3、控矿因素定量组合控矿理论 矿床的形成并非受单一地质因素控制,也非任意几个因素的简单拼凑;而是由若干个因素有机耦合并通过一定的数量关系合理搭配的结果,这种合理搭配就是成矿的充要条件。为此,要深入分析这些控矿因素的定量组合。 控矿因素定量组合分析要求不仅要系统分析成矿地质条件和找矿标志,而且要在其中找出必要的、根本的控矿因素,并分析和评价各个因素所起作用的大小、性质和方向,研究其在成矿过程中的参与程度与合理“剂量”。
控矿因素定量组合研究的内容: 1)查明各种因素在成矿中所起作用的方向、性质和大小(有利、不利、无影响 )。如接触带、断裂等在不同条件下其控矿作用是不同的。 2)研究各种控矿因素在成矿作用中的参与程度和剂量大小(有利区间)。如矿床与主断裂的距离、断裂的发育程度。 3)查明与预测工作相对应的控矿因素定量组合。这是建立矿床统计预测数学模型的重要基础。
4、“三联式”成矿预测理论 “三联式”成矿预测以各类致矿地质异常圈定为基础、以成矿多样性分析和成矿谱系研究为依据,将地质异常、成矿多样性和矿床谱系研究紧密结合,并用于指导矿产资源定量预测(赵鹏大等;2002)。
可以用多样性强度、多样性强度指数、偏多样性强度指数、资源利用率等参数来定量表征成矿多样性。如多样性强度指数: ID = ni/nmax ni-第i单元单位面积和单位剖面长度内矿种或矿产组合类型数; nmax-研究区单位面积或单位长度最大矿种或矿产组合数。 成矿多样性:由于成矿条件和致矿地质异常及其组合的多样性和复杂性,一个地区的成矿通常会表现为多样性。它是评价一个地区含矿丰度、成矿有利度和矿产资源潜力的重要指标,也是地质变量选取和预测单元划分的基础。
矿床谱系:矿床谱系是成矿多样性的某种规律性表现,包括时间谱系和空间谱系。 在同一成矿时期,矿床可以形成于不同空间部位;反之,也可以在同一空间部位有不同时期形成的矿床迭加或改造。但更多是不同时期形成的矿床产于不同的空间部位。因此,在一个地区进行成矿预测及评价时,需要分析它们的时间、空间和成因序列、建立矿床的时间谱系、空间谱系及成因谱系。 查明矿床的时空谱系对于大比例尺成矿预测具有重要指导意义。
三、 矿床统计预测一般步骤
四、地质数据预处理及其统计分布特征
地质数据可用p个地质变量的观测矩阵来表示 (i=1,2,…,n; j=1,2,…,p)
地质数据的特点 大多数地质数据是区域性变化因素、局部空间变化因素和偶然性因素综合影响的结果,即:xi=ai+bi+ri 很多地质数据是由定性资料转化而成的,用0,1或-1,0,1等二态和三态数据表示。 地质数据是通过抽样观测取得的,用它来代表总体特征必然会产生误差。 地质数据的质量和精度对成矿预测的可靠性和不确定性由重要影响
地质数据 地球化学数据 定性数据 地球物理数据 定量数据 遥感影像数据 地质数据的多总体性:矿床等地质体是漫长地质历史时期、经过多次地质作用形成的,因而通过对其进行取样获得的观测数据往往具有多总体性,其概率密度函数往往表现为双峰甚至多峰分布,又称为混合总体。 地质数据的条件性:指单个样品的体积或重量的变化可导致样本观测值分布特征的不同。所以在取样分析时,一定要考虑取样方法、位置、密度、样品大小和分析方法等。
地质数据的预处理目的: 去除或减小观测数据中所包括的随机干扰(噪音) 突出有用信息 提高数据的可利用程度 增强构置地质变量的可靠性
地质(物化探)数据预处理的内容: 数据的校正:环境、地形校正等 数据的统计分布特征研究和混合总体筛分 可疑观测值的剔除、奇异值的稳健处理 数据分布均匀化:缺失数据、过密数据 不同时间、技术条件下所获得不同水平资料的分析处理等。
地质上几种重要的概率分布模型 1、正态分布(normal distribution) 地质学中最重要、最常见的分布,其概率密度函数为: 当μ=0,σ=1时, 以上密度函数简化为:
作为总体特征值的参数,事先是未知的,它们只能分别由样本的相应特征值来代替,这种由样本导出的特征值称之为统计量。 正态分布的概率密度函数或分布函数由总体的平均值μ和标准差唯一确定: 这种描述总体分布特征的特征值称为参数,因此正态分布记为:X~N(μ, σ) ,标准正态分布X~N(0, 1) . 作为总体特征值的参数,事先是未知的,它们只能分别由样本的相应特征值来代替,这种由样本导出的特征值称之为统计量。
f(x)在( -∞, μ )区间单调上升,在x=μ处达到 极大值,在( μ , +∞ )区间单调下降。 x→±∞时,f (x) →0 以直线x=μ为轴呈对称分布 ,
正态分布的概率分布函数为:
正态分布的概率分布函数 分布函数F (x)具有以下特点: F (-∞)=0,F(+∞)=1,F(μ)=0.5 显然P(x1≤X≤x2)=F(x2)-F(x1)
在实际工作中,常常需要求出随机变量X取值落在某一区间(x1, x2)的概率即:
通过查正态分布概率密度函数表或分布函数表,并经过一些简单的计算,可以得到随机变量X: 落在(μ-σ,μ+σ)区间的概率为68.3% 落在(μ-2σ,μ+2σ)区间的概率为95.4% 落在(μ-3σ,μ+3σ)区间的概率为99.7% 落在(μ-0.67σ,μ+0.67σ)区间的概率为50% 落在(μ-1.96σ,μ+1.96σ)区间的概率为95%
混合分布和混合总体筛分 (1)定义 由一次地质作用形成的单一成因总体所构成的统计分布称为简单分布,如正态分布和泊松分布。其概率密度函数曲线是单峰曲线(unimodal)。相反,由多次地质作用叠加形成的多个成因总体所构成的统计分布称为混合分布,其概率分布曲线一般为双峰(bimodal)或多峰(polymodal)分布。 混合总体既然是多个成因总体叠加的产物,其分布一定包含有丰富的地质成因信息;因此,研究混合总体的分布具有重要的理论意义和实用价值。
(2)混合总体的筛分 从两个或两个以上的混合总体中确定出单一成因总体并对其进行参数估计的过程称为混合总体的筛分。通常在正态概率格纸上进行。
标准差相同、平均值不同的正态总体在正态概率格纸上为一组平行直线。平均数相同、标准差不同的正态总体在正态概率格纸上为相交于累积概率为50%的线上的某一点的一簇直线,而斜率各不相同。若在正态概率格纸上以概率为纵坐标,则标准差越大,直线的斜率越小。
如果数据在概率格纸上不呈直线,而是表现为一条具有拐点的曲线,则说明这批数据中有两个(以上)的总体存在,即混合总体 混合总体由A、B两个单一总体以某个比例混合而成: PA+B=fAPA+fBPB PA、PB-A、B两总体的累积概率 fA&fB-A、B两总体在混合 总体中所占的比例,fA+fB=1
混合总体的筛分 从两个(以上)的混合总体中确定出单一成因总体并对其进行参数估计的过程称为混合总体的筛分。
步 骤 1: 对原始数据进行排序、分组,计算每一组的频数、频率和累积频率,绘制数据分布直方图和频数分布曲线。
步 骤 2: 以全铁品位为横坐标、累积概率为纵坐标,在正态概率格纸上绘出实测累积频率分布曲线(每组的组中值和累积频率确定一个点;尽量使曲线连接光滑) 步 骤 3: 确定实测曲线的拐点以大致估计各成分总体在混合总体中所占比例。
步 骤 4: 根据拐点上部和下部的若干个点(尽量不要靠近拐点)的概率分别计算两个成分总体(A、B)所占的比例。 PA=PA+B/fA 对曲线下部分的总体,有: PB= (PA+B - fA) / fB
步 骤 5: 筛分、检验。 通过拐点附近若干个点作垂线分别与A、B总体相交,分别读出相应的PA, PB, PA+B,再根据PA+B=PAfA+PBfB,若计算的PA+B与实测值相差很小,说明筛分成功。 步 骤 6: 对单一正态总体进行参数估计和地质解释。
五、矿床统计预测中的地质变量研究
一、地质变量主要类型 1.观测变量(Observational variable) 对各种地质体、地质现象或地质过程可进行直接观察、测量、分析而获得原始观测数据的变量。如品位、元素丰度、矿体走向、倾角、岩体顶面标高等。
2.乘积变量(product variable) 由若干个观测变量的乘积(包括商)构成的新变量,如品位×厚度、K2O/Na2O、Co/Ni、Rb/Sr等。 两种/多种变量的组合往往可以提供更隐蔽、更重要的深层次成因信息。 Co/Ni比值可反映成矿物质以壳源或幔源为主 Fe/Mn比值反映红土型风化壳的成熟度及有关次生氧化矿床的品质。
3.综合变量(integrated variable) 将若干个独立的地质变量进行数学上的综合,构成一个新的具有特定地质意义的变量称综合变量。 如:某金矿体的前缘晕指示元素为Hg、Sb、As和Tl,而尾晕的指示元素为Cu、Pb、Zn。由于单个元素的含量变化较大,难以表示原生晕的性质和组成。这时,用多个元素的组合V1=Hg+Sb+As+Tl,V2=Cu+Pb+Zn,或比值(V1/V2)则能较有效地指示矿体可能存在的空间位置。 因子分析中的因子实际上也是综合变量,如 F1=c11Au+c12Ag+c13Bi+c14Te F2=c21Au+c22Ag+c23Zn+c24Pb 代表两个成矿阶段。
4.伪变量(virtual variable) 为了计算方便而人为附加的一个变量,又称虚拟变量。它的加入不影响计算结果。 例如在回归分析中求回归系数时,常在原始数据矩阵或相关矩阵中加上一行或一列取值为1的伪变量,使计算更为简化和方便。
地质变量的选择: (1)先多后少 (2)选取与研究对象、地质问题或研究目的密切相关的变量 工作初期尽可能地多选变量,避免漏掉有用信息,然后再进行变量的筛选、组合。 (2)选取与研究对象、地质问题或研究目的密切相关的变量 例如,当我们对某地区的斑岩铜矿进行预测时,首先应把选取变量的空间范围限定在斑岩体及附近,选取有关的岩浆岩标志、断裂裂隙系统标志、矿化分带标志、蚀变岩标志、矿物组合标志、地球化学原生晕标志、重力和电法异常等地球物理标志。
(3)注意横向可比性和纵向推断性 前者是指在已知区(模型区)选取的地质变量可以外推到未知区(预测区的类比),以保证建立的预测模型应用于研究区的效果。为此需要尽可能选取变异性较小的变量。 后者是指某些能反映深部地质和隐伏矿化特征的变量应设法加以提取,如低缓磁异常对深部铁矿床预测具有重要意义。
(4)尺度对等原则 变量选取的尺度要与预测比例尺、预测目标和任务相当。 (5)地质研究与数学分析相结合
地质变量选取的方法 1几何作图法,如点图法; 2计算简单相关系数、偏相关系数、秩相关系数; 3信息量计算法; 4秩和检验法; 5用于二态变量选择的地质向量长度分析法、相关系数比值法、变异序列法; 6各种多元统计方法,如主成分分析法、各种序贯分析法、包括全部可能回归法、逐步回归、逐步判别、序贯判别。
信息量计算法 信息量用以表征某种地质因素或标志与研究对象(矿床)的相关性,可以通过条件概率来计算。 IAj→B=A标志(如断裂)j状态(如NE向,张性)存在时B事件发生的信息量,实际工作中,由于P (B)一般不容易确定,但根据概率乘法原理,上式可变换为:
具体运算时,总体概率用样本频率来估计
计算出各标志状态的信息量后,将所有标志状态的IAj→B按大小顺序排列,计算正信息量总和 。给定有用信息水平k(一般0 计算出各标志状态的信息量后,将所有标志状态的IAj→B按大小顺序排列,计算正信息量总和 。给定有用信息水平k(一般0.75),计算有用信息△I += (n为具正信息量的标志状态数),将各标志状态的信息量由大到小进行累积,累积到△I +时的前p个地质标志状态就是我们所要选取的有利地质因素(变量)。
三、地质变量的取值 1.定量变量的取值:直接观测、测试等。 2.定性变量的取值:在进行数学处理和统计分析之前,必须对定性变量以某种方式进行赋值。 (1)按1,0或-1,0,1的方式直接赋值
某矿床的矿体一般分布在距花岗岩体150-400m范围内,这时,“距花岗岩体距离”这一变量取值可有两种状态,
(2)按统计、计算结果赋值 利用某些统计分析方法,如地质特征向量长度分析法、信息量计算及条件概率法等,对定性变量与矿床的关系进行统计分析,得到表征定性变量控矿作用程度的具体数值(如有利成矿断层的产状)。 (3)多个定性变量经统计计算后的综合赋值。 如用因子得分表示某个矿化阶段的矿化程度 F1=c11Au+c12Ag+c13Bi+c14Te F2=c21Au+c22Ag+c23Zn+c24Pb
地质变量的取值和综合变量的构置 地质变量的取值 室内取值 野外取值 地质矿产图件 物化探异常图件 遥感解释图件 各种主要控矿地质因素研究的专题图件 室内取值 是在充分研究控矿地质条件和找矿标志基础上,设计制定“预测找矿信息卡片”按网格单元或矿化异常单元逐个进行野外填写。 野外取值
地质变量的变换 使地质变量尽可能呈正态分布; 统一地质变量的数据水平; 使两变量间的非线性关系变换为线性关系; 用一组新的为数更少的相互独立变量代替一组有相关联系的原始地质变量。
标准化变换 极差化变换 均匀化变换 统一量纲/统一数据水平 对数变换 平方根变换 反余弦或反正弦变换 偏态分布→正态分布 化直变换 (双曲线、幂函数、 、指数函数、对数函数等) 非线性→线性 R型主成分分析 使原始变量的个数减少且互相独立