近期科研汇报报告人：纪爱兵.

Slides:

Advertisements

Similar presentations

灰色系統理論中的關聯分析建國科技大學温坤禮電機工程學系灰色系統粗糙研究室 (Grey System Rough Center: GSRC)

Advertisements

计算机辅助医学临床决策支持系统（下）刘雷上海生物信息技术研究中心提纲背景知识 1 基本概念 2 实例介绍 4 关键技术 3.

咨询委年度工作总结 2008 年 1 月 28 日林励吾. 结合清洁能源国家实验室建设的咨询结合清洁能源国家实验室建设的咨询协作重大项目协作重大项目配合职能部门（科技处、信息中心）进行战略研究配合职能部门（科技处、信息中心）进行战略研究考察调研（中科院大连科技创新园）考察调研（中科院大连科技创新园）

“ 育人 ” 即 “ 育己 ” 的五年答辩人：晏向华研究方向：动物分子营养学单位：动物科技学院动物营养与饲料科学系 2012 年研究生指导教师 “ 教书育人奖 ” 答辩.

2016年9月8日 2016年9月8日 2016年9月8日 1 Semi-supervised Learning by Sparse Representation Shuicheng Yan Huan Wang Lecturer: Yitao Zhai.

易腐性商品三階段最佳補貨策略之研究黃嘉彥教授勤益科技大學研發科技與資訊管理研究所.

Some theoretical notes on boosting

第一章　会计信息系统第一节　计算机会计概述.

Basic concepts of structural equation modeling

王晨指导教师：张军平副教授复旦大学计算机科学技术学院上海市智能信息处理重点实验室

Chapter 3 預測.

資料探勘(Data Mining)及其應用之介紹

邹权 (博士、副教授) 厦门大学数据挖掘实验室

第七章紋理描述與分類.

國立勤益科技大學電資學院院長候選人蕭鳳翔 2010年4月29日.

一、现状与问题整体竞争能力不强服务品质不高市场秩序失范管理效率低下旅游旺季人满为患资源和环境保护不力欺客宰客的现象时有发生

課程：高等微處理機設計專題(0309) 授課老師：陳友倫老師連絡信箱：

魏普文山东大学密码技术与信息安全教育部重点实验室

決策分析研究室巫沛倉劉浩天胡承方義守大學工業工程與管理學系.

陆哲明博士、教授哈尔滨工业大学自动化测试与控制研究所哈尔滨工业大学信息对抗技术研究所

统计学习基础卿来云中国科学院研究生院信息学院 / 统计对研究的意义：

libD3C: 一种免参数的、支持不平衡分类的二类分类器

第六章计算智能 6.1 概述 6.2 神经计算 6.3 进化计算 6.4 模糊计算 6.5 粗糙集理论 6.6 其他.

文本分类综述王斌中国科学院计算技术研究所 2002年12月.

丁承國立交通大學經營管理研究所教授成大統計68級民國103年6月14日

DSS架構其他以電腦為基礎之系統資料：外部與內部資料管理模式管理知識管理使用者界面管理者(使用者)

支持向量机 Support Vector Machines

計算方法設計與分析 Design and Analysis of Algorithms 唐傳義

植生工程植材選用決策支援系統指導：錢滄海授課：林俐玲學生：楊孟叡.

Department of Computer Science & Information Engineering

Source: IEEE Access, vol. 5, pp , October 2017

On Some Fuzzy Optimization Problems

Knowledge Engineering & Artificial Intelligence Lab (知識工程與人工智慧)

研究、論文、計畫與生活之平衡演講人：謝君偉元智大學電機系 2018年11月22日.

An Introduction to Computer Science (計算機概論)

Bounding Box Accuracy in Pedestrian Detection for Intelligent Transportation Systems David Fern´andez, Ignacio Parra, Miguel ´Angel Sotelo, Pedro A.

Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育

基于自适应同步的网络结构识别陆君安 School of Mathematics and Statistics, Wuhan University （复杂网络论坛,北京,April.27-29th,2011)

Randomized Algorithms

VISP+MS 国际高校访问学生及统计理学硕士项目

主講人陳陸輝特聘研究員兼主任政治大學選舉研究中心

線性相關與直線迴歸基本概念線性相關：兩個連續變項的共變關係，且有線性關係。所謂的線性關係乃指兩個變項的關係可以被一條最具

2002年国家自然科学奖答辩材料剪辑此获奖项目包含三大部分这里仅介绍神经网络非线性逼近理论上世纪 90年代的热点课题

The Nature and Scope of Econometrics

深度学习（Deep Learning）.

一般論文的格式註：這裡指的是一般 journal papers 和 conference papers 的格式。

关键技术数据库构建文本处理声学建模最优搜索波形处理.

研究經驗與趨勢分享黃悅民 Department of Engineering Science,

模糊系统与模糊控制简介－－博士生论坛系列报告.

先生们，大家好！尊敬的各位先生，下午好！西安交通大学理学院科学计算系褚蕾蕾

模式识别与智能系统研究中心介绍 2017年8月.

分子建模与模拟导论主讲：王延颋，中国科学院理论物理研究所助教：邓礼，中国科学院理论物理研究所

VII. Data Compression (A)

前向人工神经网络敏感性研究曾晓勤河海大学计算机及信息工程学院 2003年10月.

Error Control Coding Spring 2016 Course Syllabus

IEEE Computer Society 長亨文化事業有限公司.

系统科学与复杂网络初探刘建国上海理工大学管理学院

社会研究方法第7讲：社会统计2.

第四章 Petri网的结构性质.

(二)盲信号分离.

Speaker : YI-CHENG HUNG

古佳怡 AI 人工智慧.

数据挖掘导论福建医科大学郑伟成.

关于研究的若干问题陈熙霖.

國立高雄餐旅學院餐飲管理系副教授劉聰仁博士編撰

WiFi is a powerful sensing medium

Gaussian Process Ruohua Shi Meeting

Presentation transcript:

近期科研汇报报告人：纪爱兵

汇报内容：第一部分：基于模糊训练数据的支持向量机与模糊线性回归第二部分：基于模糊Choquet积分的非线性模糊回归

1.问题提出支持向量机（SVM）（Support Vector Machine）是Vapnik等人根据统计学习理论提出的一种新的通用学习方法，支持向量机分为分类型支持向量机和回归型支持向量机，在分类型支持向量机中，训练样本的输入是实数值向量，输出是类别，用表示。

1.问题提出考虑到训练样本集中的噪音，Chun-fu Lin[4]引入了一种模糊支持向量机，其训练样本的输入仍是实数值向量，输出是带有隶属度的类别，他用一个隶属度来表示一个训练样本隶属于正类或负类的程度，但本质上来说，它还是Vapnik 意义上的普通支持向量机。

1.问题提出事实上，由于噪音和测量的误差，训练样本数据常常是不确定的或是模糊的，对于训练数据是模糊数据的情况迄今尚无人研究，因此研究基于模糊训练数据的支持向量机非常有意义。在本文中，我们将首次引入训练数据是模糊数的分类型支持向量机的理论，主要包括模糊线性可分和模糊近似线性可分的概念以及基于模糊训练样本的支持向量机的数学模型，并给出它的求解方法。

1.问题提出而普通的支持向量机是它的一个特殊情况。然后将此方法应用于冠心病的鉴别诊断。最后，我们应用基于模糊训练数据的支持向量机理论来研究模糊线性回归问题，给出了模糊输入、模糊输出的模糊线性回归问题的一种新的解法。

2.准备知识这里主要给出两分类型支持向量机的有关知识，对于训练样本集：分别表示正类和负类。如果存在(w,b)使得（1）则称训练样本是线性可分的。（1）式可以简化为（2）分类的决策规则为：

2.准备知识为了使得决策规则具有好的推广能力，我们应使分类间隔最大，以上机器学习的问题可转化为一个凸二次规划问题：此问题有全局最优解，它的对偶问题为：

2.准备知识 Maximize s.t. 当样本不是线性可分时，我们可以通过一个映射将数据映射到一个高维特征空间H，并在高维特征空间上构造分类超平面。

2.准备知识记称为核函数考虑到一些样本可能被错分，我们引进松弛变量。则此问题可转化称为核函数考虑到一些样本可能被错分，我们引进松弛变量。则此问题可转化这里 C为惩罚参数，它可以平衡最大间隔和错分样本。以上二次规划的对偶问题为：

2.准备知识 Maximize s.t. (8) 此时的决策函数为：

3 模糊数和可能性测度定义3.1 设 X为非空集，P(X) 为X的幂集, 映射Pos: P(X) [0,1], 如果满足： 3 模糊数和可能性测度定义3.1 设 X为非空集，P(X) 为X的幂集, 映射Pos: P(X) [0,1], 如果满足： (1) Pos( )=0 (2) Pos(X)=1 (3) Pos( )= Pos( ) 则称Pos为可能性测度。定义3.2 设为模糊数，它的隶属函数为：

3 模糊数和可能性测度 (其中为实数)，则称为三角形模糊数，记为 ( )。定义 3.3 设为模糊数,模糊事件的可能性测度定义为： 3 模糊数和可能性测度 (其中为实数)，则称为三角形模糊数，记为 ( )。定义 3.3 设为模糊数,模糊事件的可能性测度定义为：特殊地, 当b 为实数时，模糊事件的可能性测度为：。类似地,

3 模糊数和可能性测度如果均为模糊数，则称为n维模糊数向量，以表示n维模糊数向量的全体。特别地，如果均为三角形模糊数，则称为n维三角形模糊数向量。以表示n维三角形模糊数向量的全体。由Zadeh扩展原则，对于n元函数f: 和模糊数向量，为模糊数，其隶属函数为：

3 模糊数和可能性测度特别地，当为模糊数时，类似可定义且易得：定理3.1 设，为三角形模糊数, 为实数，则 (1) ; (2)

3 模糊数和可能性测度定理 3.2 设为三角形模糊数，则定理 3.3 设为三角形模糊数，则对给定的置信水平 , , 等价于 : 。

4. 基于模糊训练数据的分类型支持向量机考虑模糊训练样本S= , 其中, , , 当称为正类；当则称为负类，基于模糊训练样本集 S= 的分类就是寻找一个决策函数，使得正类和负类能以最低的分类错误被分开并且具有好的推广能力。 4.1 基于模糊线性可分训练样本集的支持向量机

4. 基于模糊训练数据的分类型支持向量机定义4.1 对模糊训练样本集S= , 如果对给定的置信水平，存在，使得 (9)

4. 基于模糊训练数据的分类型支持向量机其中且为三角形模糊数，则式（9）等价于 (10) (证明略）其中且为三角形模糊数，则式（9）等价于 (10) (证明略）基于模糊现行可分训练样本集的支持向量机就是求解以下模糊机会约束规划： s.t. (11) ,

4. 基于模糊训练数据的分类型支持向量机我们可以利用混合智能算法[17，18]，求解模糊机会约束规划（11）。由定理4.1模糊机会约束规划（11）可以转化为以下经典的凸二次规划问题： s.t . (12) （12）的对偶问题为： Maximize (13)

4. 基于模糊训练数据的分类型支持向量机 s.t. 这里 , 其中为规划 (13)的解这里 , 其中为规划 (13)的解 4.2. 基于近似模糊线性可分训练样本集的支持向量机考虑到可能有一些样本被错分（按置信水平，不满足（9）式），我们引进松弛变量，其中。对模糊训练样本集S= ，如果对给定的置信水平，如果存在 , 使得，则称模糊训练样本集 S关于置信水平为近似模糊线性可分的。

4. 基于模糊训练数据的分类型支持向量机为了求，我们可以用混合智能算法求解下面模糊机会约束规划： s.t. (14) 为了求，我们可以用混合智能算法求解下面模糊机会约束规划： s.t. (14) 类似地，利用定理4.1，以上模糊机会约束规划可转化为下面的经典凸二次规划问题：

4. 基于模糊训练数据的分类型支持向量机 s.t . (15) (其中C为惩罚参数)。规划（15）的对偶问题为： Maximize

4. 基于模糊训练数据的分类型支持向量机应用实例可以利用优化软件如Lingo来求解规划问题（15）（16），得到。则对于未知类别的样本，其决策规则为：若对给定的置信水平 , 如果 , 则为正类；如果 , 则为负类。应用实例下面，我们将应用以上基于模糊训练样本的两分类支持向量机的理论于冠心病的鉴别诊断。我们收集了34名患者的资料，以24名患者的资料作为训练样本，其中一半为正常人，表示为 =1，另一半为冠心病患者，表示为 =-1，数据见表1，其中舒张期血压，表示血浆胆固醇含量，且和为三角形模糊数。

4. 基于模糊训练数据的分类型支持向量机表1：冠心病人和正常人舒张期血压和血浆胆固醇含量数据

4. 基于模糊训练数据的分类型支持向量机取参数C=0.1, ，利用以上数据来训练以上规划（15）或（16），可得解 , b=-6.962587, 则可以得到冠心病的鉴别诊断规则：对给定的置信水平 , 如果 , 则为冠心病患者；如果 ,则为正常人。利用此鉴别诊断规则来拟合表1种的数据，只有三例被错分，诊断正确率为87.5%。用另外10例患者的资料作为测试样本，经测试正确率为90%。由此充分说明基于模糊训练样本的支持向量机具有好的拟合效果和高的预测精度。

5. 基于模糊支持向量机的模糊线性回归设输入为模糊数向量, 输出为模糊数。为简单起见，我们设 ) 和均为三角型模糊数。所谓模糊线性回归就是确定关系: 对于模糊训练集S= , 其中 , 。对给定的 , 令为正类集，为负类集。

5. 基于模糊支持向量机的模糊线性回归以为模糊训练集，则模糊线性回归问题可以转化为基于模糊训练集的支持向量机的分类问题。以为模糊训练集，则模糊线性回归问题可以转化为基于模糊训练集的支持向量机的分类问题。如果关于置信水平为模糊近似线性可分的, 则由上面基于模糊训练集的支持向量机分类问题的理论，我们只需解下面的模糊机会约束规划： s.t. （19）假定 , , , 则与规划(19)等价的经典的二次规划为：

5. 基于模糊支持向量机的模糊线性回归 s.t．（20）用Lingo 80 求解以上二次规划得。由定理3.4，规划（19）的约束条件等价于：

5. 基于模糊支持向量机的模糊线性回归则在置信水平下，得到关系: 或则则在置信水平下，得到关系: 或则应用实例利用文献[28]中的数据作为模糊训练集，见表2，当参数C=0.1, , 求解二次规划（20），可得模糊线性回归关系：且当，即 , 为经典实数时，恰好与普通的线性回归相一致。

5. 基于模糊支持向量机的模糊线性回归表2

6. 结论本文讨论了训练数据为模糊数的支持向量机分类理论，并且给出了具体的求解方法，它极大扩展了普通支持向量机的理论和应用范围，V.N. Vapnik的支持向量机是它的一个特殊形式。并且，我们应用基于模糊训练数据的支持向量机分类理论，通过将模糊线性回归问题转化为基于模糊训练数据的支持向量机分类问题给出了一种求解模糊线性回归的新方法。进一步我们将研究非可分模糊训练数据的支持向量机理论。

References [1] V.N. Vapnik, The Nature of Statistical Learning Theory,Springer-Verlag, New York, 1995. [2] V.N. Vapnik, Statistical Learning Theory, Wiley, New York,1998. [3] C. Cortes, V.N. Vapnik, Support vector networks, Mach.Learn. 20 (3) (1995) 273–297. [4] Chun-fu Lin, Sheng-de Wang ，Training algorithms for fuzzy support vector machines with noisy data，Pattern Recognition Letters 25 (2004) 1647–1656 [5] J.M. Keller, D.J. Hunt, Incorporating fuzzy membershipfunctions into the perceptron algorithm, IEEE Trans. PAMI7 (1985) 693–699. [6] J.-H. Chen, C.-S. Chen, Fuzzy kernel perceptron, IEEE Trans.Neural Networks 13 (6) (2002) 1364–1373. [7] W. Shitong, Fuzzy Systems and Fuzzy Neural Networks and Their Programming, Press of Shanghai Science and technologies, Shanghai, 1998 (1st ed.), 2000 (2nd ed.). [8] C. Angulo, X. Parra, A. Catala, K-SVCR: a support vector machine for multiclass classification, J. Neurocomput., in press (download the paper from http://www.computerscience Web.com). [9] D. Tsujinishi, S. Abe, Fuzzy least square SVM for multiclass problems, J. Neural Networks 16 (2003) 785–792. [10] Tomonori Kikuchi, Shigeo Abe, Comparison between error correcting output codes and fuzzy support vector machines,Pattern Recognition Letters 26 (2005) 1937–1945 [11] Daisuke Tsujinishi,Shigeo Abe, Fuzzy least squares support vector machines for multiclass problems, Neural Networks 16(2003)785-792 [12] Dug Hun Hong,Changha Hwang, Support vector fuzzy regression machines, Fuzzy Sets and Syetems 138(2003) 271-281

References [13] Jin-TsongJeng,Chen-Chia Chuang,Shun-FengSu, Support vector interval regression networks for interval regression analysis, Fuzzy Sets and Systems 138 (2003) 283–300 [14] Zadeh LA. Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems 1978;1:3–28. [15] Dubois D, Prade H. Possibility theory. New York: Plenum Press; 1988. [16] Klir GJ. On fuzzy-set interpretation of possibility theory. Fuzzy Sets andSystems 1999;108:263–373. [17] Liu B. Uncertain programming. New York: Wiley; 1999. [18] Liu B. Theory and practice of uncertain programming. Heidelberg: Physica; 2002. [19] Liu B. Minimax chance constrained programming models for fuzzy decision systems. Information Sciences 1998;112:25–38. [20] Liu B. Dependent-chance programming in fuzzy environments. Fuzzy Sets and Systems 2000;109(1):97–106. [21] Liu B. Fuzzy random chance-constrained programming. IEEE Transactions on Fuzzy Systems 2001;9(5):713–20. [22] Liu B. Fuzzy random dependent-chance programming. IEEE Transactions on Fuzzy Systems 2001;9(5):721–6. [23] Liu YK, Liu B. Fuzzy random variable: a scalar expectedvalue operator. Fuzzy Optimization and Decision Making 2003;2(2):143–60. [24] P. Diamond, Fuzzy least squares, Inform. Sci. 46 (1988) [25] H. Tanaka, Fuzzy data analysis by possibilistic linear models, Fuzzy Sets and Systems 24(1987) [26] H. Tanaka, S. Uejima, K. Asia, Linear regression analysis with fuzzy model, IEEE Trans.Systems, Man Cybernet. [27] M. Sakawa, H. Yano, Multiobjective fuzzy linear regression analysis for fuzzy input–output data, Fuzzy Sets and Systems 47 (1992) [28] HSIEN-CHUNG Wu,Linear Regression Analysis for Fuzzy Input and Output Data Using the Extension Principle, Computers and Mathematics with Applications 45 (2003) [29] Scholkoph B,Smola A J,Bartlett P L, New support vector Algorithms, Neural Computation,2000,12（5）

本论文需进一步考虑的工作本文只是基于模糊训练数据的线性可分或近似线性可分的情况下的支持向量机理论。当模糊训练数据集是非线性可分的情况下，是否可通过模糊核函数（经典核函数通过Zadeh扩展原理得到），映射到高维模糊模糊特征空间，从而得到基于模糊训练数据的一般支持向量机理论？在本文中，进一步可考虑分类是模糊类或类与类之间界限不分明的基于模糊训练数据的支持向量机理论将文中的可能性测度Pos换为可信性测度是否会得到更好的分类器（因为可信性测度具有自对偶性，而可能性测度不具有）利用可能性测度或可信性测度研究基于模糊数据的回归型支持向量机理论