1. 数据挖掘简介 2. 非线性规划及其对偶理论 3. 支持向量机理论、算法与应用 《数据挖掘中的 数学方法》 1. 数据挖掘简介 2. 非线性规划及其对偶理论 3. 支持向量机理论、算法与应用
数据挖掘简介
一、数据挖掘概念----定义 是多学科交叉的 统计学、人工智能、机器学习、数据库技术、最优化技术 数据挖掘--从大量数据中寻找其规律,提取感兴趣的、有用的或潜在有用的信息的技术,是统计学、数据库技术和人工智能技术的综合。 是多学科交叉的 统计学、人工智能、机器学习、数据库技术、最优化技术 数据挖掘与KDD(Knowledge Discovery in Databases ) 知识发现
国民经济和社会的信息化 数据挖掘的原由 数据挖掘 有价值的知识 可怕的数据 社会信息化后,社会的运转是软件的运转 数据采集技术越来越成熟! 国民经济和社会的信息化 社会信息化后,社会的运转是软件的运转 社会信息化后,社会的历史是数据的历史 政府提出:“信息化”和“发展软件产业” 数据库越来越大 数据挖掘 有价值的知识 可怕的数据
——数据爆炸,知识贫乏 苦恼: 淹没在数据中 ; 不能制定合适的决策! 数据 决策 知识 模式 趋势 事实 关系 模型 关联规则 序列 ….. 目标市场 资金分配 贸易选择 在哪儿做广告 销售的地理位置 …… 金融 经济 政府 POS. 人口统计 生命周期 疾病数据 ………. ——数据爆炸,知识贫乏
数据挖掘的技术 技术分类 数据挖掘技术 预言(Predication):用历史预测未来 描述(Description):了解数据中潜在的规律 关联分析 序列模式 分类(预言) 聚集(聚类) 异常检测
http://baike.baidu.com/view/7893.htm 数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
数据挖掘一般是指从大量的资料中自动搜索隐藏于其中的有着特殊关联性(属于Association rule learning)的信息的过程。资料挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 数据挖掘——维基百科,自由的百科全书
数据挖掘问题的数学表述
四、数据挖掘应用 调查报告(2002.6.3-6.16)
数据挖掘软件的现状 2001/5/14——2001/5/24(实际) 2001/11/26——2001/12/9(预测)
http://www.kdnuggets.com/polls/index.html
非线性规划及其最优性条件
非线性规划 非线性规划向量化表示 p=q=0即无约束规划 约束集或可行域: x*是整体(全局)极小点 x*是严格整体(全局)极小点
非线性规划的几个概念 线性化可行方向:
当i=1,2,…,p时为凸函数,当i=p+1,…,p+q时为线性函数。 严格凸组合 严格凸 线性组合 若f(x)是凸函数,S是凸集, 为凸规划。 凸规划的局部解是整体解! 一般要求 当i=1,2,…,p时为凸函数,当i=p+1,…,p+q时为线性函数。
定理:可微函数解的必要条件:x*是局部解,则: 可微凸函数解的充要条件:x*是整体极小解当且仅当 最优性条件 无约束规划 定理:可微函数解的必要条件:x*是局部解,则: x*是驻点(稳定点) 可微凸函数解的充要条件:x*是整体极小解当且仅当
约束规划最优性条件的几何表述 梯度共线
约束规划最优性条件的几何表述 共面
约束规划最优性条件的几何表述 结论:在解处仅等式约束有效!
梯度的线性表示 定义7. 有效约束(紧约束、积极约束)——active constraint 在x*处有 则称在x*处ci(x)是紧约束。 对约束 x*处有效约束指标集
约束规划最优性必要条件 Karush-Kuhn-Tucker 条件——KKT条件 向量化表示
Karush-Kuhn-Tucker条件——KKT条件 Lagrange函数 Lagrange乘子: 互补松弛条件: Karush-Kuhn-Tucker条件——KKT条件 约束规格——约束限制(规范)条件
约束规划最优性充分条件 鞍点条件 证明: 由 的任意性知: 且 进一步由不等式的后两部分知: 同时 的最优解!
Karush-Kuhn-Tucker条件——KKT条件 凸规划最优性充要条件 Karush-Kuhn-Tucker条件——KKT条件
最优性条件总结 1) 所有规划解的最优性必要条件=KKT条件+约束规格 2) 凸规划解的最优性充分条件=KKT条件 最优性必要条件证明:需要用到凸集分离定理、择一性定理(Farkas引理)——严格证明《凸分析与最优化理论》课程 最优性充分条件证明较简单,但对非凸规划结果没有实际指导意义,蕴含着对偶原理——Langrange对偶(下节讨论)
最优性条件举例 线性规划 最优性条件 作业 是充分的?是必要的? 标准形式: 练习:推广形式的最优性条件
最优性条件举例 二次规划 最优性条件 什么条件下是充分的? 什么条件下是必要的? 推广二: 推广一: 作业 简化: