王飞跃的个人博客分享 http://blog.sciencenet.cn/u/王飞跃

博文

区间二型模糊集和模糊系统: 综述与展望

已有 7239 次阅读 2021-2-8 10:29 |个人分类:论文交流|系统分类:论文交流

引用本文: 伍冬睿, 曾志刚, 莫红, 王飞跃. 区间二型模糊集和模糊系统: 综述与展望. 自动化学报, 2020, 46(8): 1539−1556 doi: 10.16383/j.aas.c200133 

Citation:Wu Dong-Rui, Zeng Zhi-Gang, Mo Hong, Wang Fei-Yue. Interval type-2 fuzzy sets and systems: Overview and outlook. Acta Automatica Sinica, 2020, 46(8): 1539−1556 doi: 10.16383/j.aas.c200133


区间二型模糊集和模糊系统: 综述与展望


伍冬睿,  曾志刚,  莫红,  王飞跃


摘要: 一型模糊集可以建模单个用户的语义概念中的不确定性, 即个体内不确定性. 一型模糊系统在控制和机器学习中得到了大量成功应用. 区间二型模糊集能同时建模个体内不确定性和个体间不确定性, 因而在很多应用中显示了比一型模糊系统更好的性能, 是近年来的研究热点. 本文首先介绍了区间二型模糊集的重要概念和理论研究进展, 总结了其在决策和机器学习中的成功应用, 然后介绍了区间二型模糊系统的基本操作和理论研究进展, 并回顾了其在控制和机器学习中的典型应用. 最后, 对区间二型模糊集和模糊系统未来的研究方向进行了展望.


关键词: 区间二型模糊集, 区间二型模糊系统, 模糊控制, 感知计算 


Interval Type-2 Fuzzy Sets and Systems: Overview and Outlook


WU Dong-Rui1, ZENG Zhi-Gang1, MO Hong2, WANG Fei-Yue3 


Abstract: Type-1 fuzzy sets can model the linguistic uncertainty from a single user, i.e., intra-personal uncertainty. Type-1 fuzzy systems have been widely used in controls and machine learning applications. Interval type-2 fuzzy sets can simultaneously model both intra-personal uncertainty and inter-personal uncertainty, and hence have demonstrated better performance than type-1 fuzzy systems in many applications, becoming a hot research topic recently. This paper first introduces main concepts and theoretical research progresses of interval type-2 fuzzy sets, summarizes their successful applications in decision-making and machine learning, then introduces basic operations and theoretical research progresses of interval type-2 fuzzy systems, and reviews their typical applications in controls and machine learning. Finally, it points out several future research directions on interval type-2 fuzzy sets and systems.


Key words: Interval type-2 fuzzy set, interval type-2 fuzzy system, fuzzy control, perceptual computing 


经典逻辑(也称二值逻辑或布尔逻辑)认为所有事物或陈述都可以用二元项(比如0或1, 是或否, 黑或白)来表示. 给定一个集合X, 其论域内的每个元素要么完全属于该集合X, 要么完全不属于X, 不存在部分属于X的情况.


但是, 人们日常交流中使用的语义概念往往具有不确定性, 而且元素是否属于某个语义概念经常是个渐变而非突变的过程, 不能简单用非黑即白来描述. 比如劳动保护法为了消除歧义, 可能规定35度以上为“高温”, 这样“高温”就是一个二值逻辑, 35.0度为“高温”, 34.9度不是“高温”. 其集合表示如图1 (a)所示. 但是在人们的理解和体感中, 35.0度和34.9度并没有本质的区别. 语义概念中的“高温”是渐变而非突变的: 35.0度以上属于“高温”, 但是34.9度也不是完全不属于“高温”, 只是它属于“高温”这个概念的隶属度比35.0度稍微低一点点. 同理, 34.5度也应该算作“高温”, 只是它的隶属度比34.9度再稍低一些.


AAS-CN-2020-0133-1.jpg

图 1  “高温”的不同集合表示

Fig. 1  Different representations of “High temperature”


为了更好地建模语义概念, 加州大学伯克利分校Zadeh教授于1965年首次提出了模糊集(Fuzzy set)的思想[1]. 为了与以后进一步扩展的其他模糊集思想区分, 本文中把Zadeh于1965年提出的模糊集称为一型模糊集(Type-1 fuzzy set). 图1 (b)是对应于“高温”这个语义概念的一个一型模糊集. 30至35度之间的温度也都属于“高温”, 只是有不同的隶属度. 相对于经典逻辑, 一型模糊集可以更好地建模单个用户对于语义概念理解的不确定性, 即个体内不确定性(Intra-personal uncertainty).


然而, 对于同一个语义概念, 不同用户可能也有不同的理解, 即个体间不确定性(Inter-personal uncertainty). 比如, 对于“高温”这个概念, 北方人和南方人的理解就不完全一致. 一型模糊集不能建模个体间不确定性, 因为每个元素的隶属度是个确定的值: 为什么34.5度属于“高温”的隶属度必须是0.9而不是0.85呢? 不同用户可能有不同的看法. 为了更好地建模个体间不确定性, Zadeh于1975年又提出了二型模糊集(Type-2 fuzzy set, T2 FS)[2]. 因其表示和理解较为复杂, 目前应用较多的是二型模糊集的一个特例, 区间二型模糊集1 (Interval type-2 fuzzy set, IT2 FS)[10], 如图1 (c)所示. 在区间二型模糊集中, 论域中每个元素的隶属度变成一个区间, 而非一个确定的值. 比如, 35度属于“高温”的隶属度区间可能是[0.8,1]. 当然, 如果不同用户对于某个元素的隶属度的看法完全一致, 那么该隶属度区间也可以退化为一个确定的值, 比如图1 (c)中温度高于37度的部分, 其隶属度区间为[1,1], 或直接记为1.


基于一型模糊集构造的模糊系统被称为一型模糊系统(Type-1 fuzzy system). 1973年Zadeh提出一型模糊系统可以用于控制领域[11]. 1974年Mamdani首次成功地将一型模糊系统应用于锅炉和蒸汽机的控制[12]. 1976年丹麦Blue Circle Cement and SIRA公司开发了一个水泥窖模糊控制系统, 成为第一个工业模糊控制系统[13]. 1987年日本仙台地铁成为第一个成功应用模糊控制的大型工程. 此后模糊控制成为了一型模糊系统最成功和最广泛的应用领域[10].


虽然理论上区间二型模糊集能够同时建模个体内和个体间不确定性, 因而比一型模糊集更强大, 但是因为其相对于一型模糊集有更复杂的概念和运算, 在很长时间内并没有受到研究者的重视, 如图2所示. 一直到2000年左右, 在美国南加州大学Mendel教授及其学生的大力推动下, 才逐渐成为模糊系统领域的研究热点, 并在决策、控制、机器学习等领域得到了广泛应用.


AAS-CN-2020-0133-2.jpg

图 2  谷歌学术中包含“type-2 fuzzy”的论文数量

Fig. 2  Number of publications on “type-2 fuzzy” in Google Scholar


然而, 除了潘永平等[14]在2011年做过一个关于二型模糊控制的综述, 目前中文文献中并没有对区间二型模糊集和模糊系统的最新的综述. 本文对区间二型模糊集和模糊系统的基本概念、理论和应用进行了系统性的综述, 并指出了未来的几个研究方向, 为下一步深入研究确立了良好的基础. 本文默认读者对一型模糊集和模糊系统已经有一定了解, 所以较少介绍相关背景知识. 需要的读者可以参考文献[10, 15-16].


1.   区间二型模糊集理论


1.1   区间二型模糊集基本概念


一般二型模糊集(General type-2)是三维空间中的集合, 如图3 (a)所示, 其中x为论域X中的元素, u为x的主隶属度, z∈[0,1]为x的次隶属度. 对于如图3 (b)所示的区间二型模糊集, z恒定为1.


AAS-CN-2020-0133-3.jpg

图 3  二型模糊集

Fig. 3  Type-2 fuzzy sets


区间二型模糊集中比较重要的概念有[10]:


1)上隶属度函数(Upper membership function, UMF): 论域上任意一点及其对应的隶属度区间的上界所构成的一个一型模糊集.


2)下隶属度函数(Lower membership function, LMF): 论域上任意一点及其对应的隶属度区间下界所构成的一个一型模糊集. 下隶属度函数可以是非正规的(Non-normal), 即其最大的隶属度不为1.


3)不确定覆盖域(Footprint of uncertainty, FOU): 所有上隶属度函数和下隶属度函数之间的区域构成不确定覆盖域.


4)嵌入一型模糊集(Embedded type-1 fuzzy set): 任何处于不确定覆盖域之内的一型模糊集. 嵌入一型模糊集可以是非正规的, 也可以是非凸的.


2017年王飞跃和莫红[17]采用集合的形式描述了二型模糊集的特征并简化了其表述. 根据二型模糊集的新定义, 将二型模糊集分为离散型、半连通型、连通型(包括单连通和多连通)及复合型四种, 并给出了不同类型二型模糊集的表述式方法. 本文中只考虑最常见的单连通型区间二型模糊集, 但很多结果对半连通型区间二型模糊集也是适用的.


文献[17]通过引入多值映射来定义主隶属度Lx=[ax,bx],x∈X.对应的上下隶属函数及不确定覆盖域2可以分别表示为:


image.png


1.2   表示定理


区间二型模糊集的Mendel-John表示定理[18]指出, 不确定覆盖域是所有嵌入一型模糊集的并集. 这个很直观的定理有深远的理论意义, 因为其指明了所有关于二型模糊集和模糊系统的运算, 比如区间二型模糊集的不确定性度量[19]、两个区间二型模糊集之间的相似度[20]、区间二型模糊系统的推理计算和降阶[10, 21]等, 都需要考虑所有这些嵌入一型模糊集.


但是, Mendel-John表示定理要用到所有可能的嵌入一型模糊集, 包括非正规的和非凸的. 这样的一型模糊集在现实生活中很少用到, 而且跟人们的理解也有所偏差. 所以, Wu等[22]提出了Wu-Zhang-Huang受限表示定理: 对于形状良好的区间二型模糊集, 其不确定覆盖域是所有正规且凸的嵌入一型模糊集的并集. 这里的“受限”特指考虑的所有嵌入一型模糊集都是有限制的(正规的、凸的). 一个形状良好的区间二型模糊集必须满足三个条件: 1)正规的, 即上隶属度函数的最大值必须为1; 2)凸的, 即上下隶属度函数都必须是凸的; 3) b≤f≤g≤c, 即下隶属度函数的顶必须包含在上隶属度函数的顶之内.


Wu等[22]从理论上证明了通过常见的几种构造方法[23-25]从调查问卷中得到的区间二型模糊集都是形状良好的, 并且形状良好的区间二型模糊集通过语义加权平均[26]或排序语义加权平均[27]或感知推理[28-29]计算之后得到的结果也是形状良好的区间二型模糊集. 因而, Wu-Zhang-Huang受限表示定理既符合人们的直观理解, 也有广泛的适用范围.


D'Alterio等[30]提出了进一步受限的D'Alterio-Garibaldi-John-Pourabdollah表示定理. 首先定义一个基础一型模糊集(称为生成器), 然后对其做平移扰动, 得到受限的区间二型模糊集. 当对此受限区间二型模糊集进行运算时, 只需考虑其中所有的跟生成器形状相同但是平移后的嵌入一型模糊集.


图4显示了使用不同的表示定理时, 计算区间二型模糊集质心所使用到的嵌入一型模糊集. 很显然, Mendel-John 表示定理中使用的嵌入一型模糊集是非正规的且非凸的, Wu-Zhang-Huang受限表示定理里面使用的嵌入一型模糊集是正规的且凸的, D'Alterio-Garibaldi-John-Pourabdollah受限表示定理里面使用的嵌入一型模糊集是正规的、凸的且形状最为直观. 然而, 只有很特定的区间二型模糊集才能用D'Alterio-Garibaldi-John-Pourabdollah受限表示定理表示出来, 所以其适用范围不如前两种表示定理. 具体到质心的计算, 这三种表示定理计算出的质心区间长度依次减小并存在包含关系: Wu-Zhang-Huang的质心包含在Mendel-John的质心中, 而D'Alterio-Garibaldi-John-Pourabdollah的质心又包含在Wu-Zhang-Huang的质心中, 如图4所示.


AAS-CN-2020-0133-4.jpg

图 4  根据不同的表示定理, 计算区间二型模糊集质心所用到的嵌入一型模糊集(左边的点是由

实线嵌入一型模糊集决定的质心的下界, 右边的点是由虚线嵌入一型模糊集决定的质心的上界.)

Fig. 4  Embedded type-1 fuzzy sets in computing the centroid of the interval type-2 fuzzy set, according to different representation theorems (The left dot is the lower bound of the centroid determined by the solid embedded 

type-1 fuzzy set, and the right dot is the upper bound determined by the dashed embedded type-1 fuzzy set.)


1.3   区间二型模糊集的构造方法


使用区间二型模糊集之前, 必须有系统性的方法可以构造它们. 目前的构造方法主要有如下四种:


1)用户经验. 用户可以根据自己对相关语义概念或应用场景的理解来画出合适的区间二型模糊集. 比如, Huang 等[31]在模糊控制器设计中, 先根据专家经验确定区间二型模糊集的形状, 然后再利用线性矩阵不等式方法优化控制器的其他参数, 取得了很好的效果.


2)扰动一型模糊集. 通过某种方法, 比如用户经验或数据驱动的优化, 先构造一型模糊集, 然后再在上面施加扰动引入不确定覆盖域, 从而得到区间二型模糊集. 比如, Wu和Tan[32]首先设计一个最优的一型模糊控制器, 然后利用遗传算法扰动其中的一型模糊集来得到区间二型模糊集. 最终获得的区间二型模糊控制器具有比原始的一型模糊控制器更好的效果.


3)调查问卷. Liu和Mendel[23]提出了构造区间二型模糊集的区间法(Interval approach): 通过调查问卷, 让多个用户对一组语义概念所隐含的区间进行量化, 比如“在[0,10]这个区间中, 你认为 ‘比较大’ 对应的区间是什么?” 然后对从调查问卷中获得的每个语义概念的多个区间进行统计和模糊化处理, 得到多个一型模糊集, 再对其求并集, 得到相应的区间二型模糊集. Wu等[24]提出了增强区间法(Enhanced interval approach), 能从调查问卷中得到比区间法更合理的区间二型模糊集. Hao和Mendel[25]进一步提出了可以从单个用户提供的单个区间中构造区间二型模糊集的方法. Tahayori等[33]也提出了从一组一型模糊集中构造区间二型模糊集的方法.


4)数据驱动的优化. 比如, Wu和Tan[34]基于被控对象的数学模型, 使用遗传算法同时优化区间二型模糊控制器前件和后件的参数, 得到了性能优异的区间二型模糊控制器.


1.4   区间二型模糊集的不确定性度量


Zadeh[35]认为, 不确定性是一种信息属性. 根据应用场景的不同, 不确定性有三种不同的使用原则[36]:


1)最小不确定性原则, 即当存在多个候选解时, 应选择信息损失最少的那个. 此原则常用于化简或冲突消解问题.


2)最大不确定性原则, 即在满足约束条件的前提下, 应选择不确定性最大的那个解. 此原则常用于经典概率框架[37-39].


3)不确定性不变原则, 即在数学变换中, 不确定性的大小应该保持不变. 此原则常用于概率和模糊可能性之间的转换[40-43]. 在从调查问卷中构造区间二型模糊集的方法中[23-25]就根据区间和模糊集的方差相等这个原则, 把用户提供的均匀分布区间转换成一型模糊集.


类似于概率中有方差、峰度等不同的不确定性度量, 一型和区间二型模糊集都可以有多种不同的不确定性度量. 基于经典的表示定理, Wu和Mendel[19]给出了区间二型模糊集的五种不确定性度量(质心、基数、方差、模糊度、偏斜度)的定义和计算方法. 其中应用最广的是质心, 可以用于Mamdani模糊系统的降阶[10]和区间二型模糊集的排序[20].


基于受限表示定理, Wu等[22]提出了形状良好的区间二型模糊集对应的五种受限不确定性度量. 计算这些度量用到的嵌入一型模糊集都是正规的并且凸的, 更符合我们日常认知.


1.5   语义加权平均


加权平均是现实生活中常用的信息融合方法. 最简单的算术加权平均是


image.png


其中xi为输入, wi为权重, y为融合后的输出.但是, 很多现实生活中的决策问题都有不确定性, 所以xi和wi可能都不是确定的值, 而是考虑了不确定性的区间、一型模糊集或区间二型模糊集. 对应的加权平均就变成了区间加权平均(Interval weighted average)[21]、 模糊加权平均(Fuzzy weighted average)[21, 44]和语义加权平均(Linguistic weighted average)[21, 26, 45], 如图5所示.


AAS-CN-2020-0133-5.jpg

图 5  各种不同的加权平均

Fig. 5  Various weighted averages


语义加权平均是上述四种加权平均中最复杂的. 其数学表达式为:


image.png


其中image.png为区间二型模糊集建模的语义输入, image.png为区间二型模糊集建模的权重. 实际上, 只要任意一个image.png为区间二型模糊集, 那么输出image.png就是一个区间二型模糊集.令image.png分别为image.png的上下隶属度函数,image.png分别为image.png的上下隶属度函数, image.png分别为image.png的上下隶属度函数. Wu和Mendel[26, 45]证明:


image.png


即: image.png的模糊加权平均, image.png的模糊加权平均. 根据α-cut分解定理[46], 这些模糊加权平均又可以通过区间加权平均来计算. 而基本的区间加权平均是通过Karnik-Mendel (KM)算法[47]来计算的.


由图5可以看出, 语义加权平均是加权平均最一般化的表现形式. 其他加权平均, 如模糊加权平均、区间加权平均和算术加权平均, 都可以看做是语义加权平均的特例. 语义加权平均是目前感知计算机[21]中最重要的词计算引擎. 基于语义加权平均, Wu和Huang又提出了排序语义加权平均[48], 即把Yager的排序加权平均[49]推广到了区间二型模糊集, 可以处理更多的语义不确定性.


2. 区间二型模糊集应用


2.1   感知计算与决策


Zadeh在1996年首先提出了词计算(Computing with words)的概念, 即以自然语言中的词或术语为对象, 而不是以数值为对象的计算方法. Zadeh认为这些词或术语应该用模糊集来建模. 为了充分考虑个体内和个体间差异, Mendel[50-51]认为应该用区间二型模糊集而非一型模糊集来建模自然语言中的词或术语. 基于此, Mendel[52]进一步提出了感知计算机(Perceptual computer, Per-C)来具体实现Zadeh的词计算, 如图6所示.


AAS-CN-2020-0133-6.jpg

图 6  感知计算机

Fig. 6  Perceptual computer


感知计算机包括3个部分: 编码器, 词计算引擎, 解码器. 自然语言通过编码器被转换成区间二型模糊集(主要使用第2.3节中调查问卷的方法), 在词计算引擎中进行处理(第2.5节中介绍的语义加权平均是重要的词计算引擎), 结果表示成新的区间二型模糊集, 再通过解码器重新转换成自然语言, 以词、类别或排序的方式输出. 这样, 用户可以通过自然语言跟感知计算机直接交互, 辅助决策.


感知计算中目前输出的建议有三种形式: 词、类别和排序, 分别对应如下三种应用场景:


1)词: 这是最常见的建议类型. 比如, Acostaa等[53]利用感知计算机评估游艇对海岸生物入侵的风险, 其输出可能是“较低”、“很高”等自然语言中的词语.


2)类别: 比如, Mendel和Wu[21]利用感知计算机综合多个审稿人对期刊投稿文章的评价(多属性群体决策)并自动给出“拒稿”、“接收”等类别性的建议.


3)排序: 比如, Wu和Mendel[54]利用感知计算机进行不同战术导弹系统的选择(层次化多属性决策), 最终的输出是这些候选导弹系统的排序.


当然, 随着感知计算机应用场景的不断扩展, 可能会涌现出更多的建议形式.


除了感知计算, 人们还把区间二型模糊集应用到很多其他决策场景. Chen和Hong[55]融合了区间二型模糊集和TOPSIS进行多属性群体决策. Qin等结合VIKOR和区间二型模糊集进行了多属性决策中的风险评估[56], 并结合TODIM和区间二型模糊集进行了多准则群体决策中的绿色供应商选择[57]. 李润梅和梁秋鸿[58]利用区间二型模糊集进行了人工交通系统可信度评估.


 2.2   语义摘要


语义摘要(Linguistic summarization)能够自动从数据中归纳总结出以自然语言描述的模式或结论(比如“周六的销售大部分集中在中午时段”), 有助于人们对数据的交流和理解. Yager[59]最早提出可以用一型模糊集来进行语义摘要. Wu和Mendel[60]提出了用区间二型模糊集进行语义摘要的方法, 产生的“IF-THEN”规则可以用于建立感知计算或模糊系统中的规则库. Boran和Akay[61]进一步引入了概率真实度来衡量所产生的规则摘要的好坏.


3.   区间二型模糊系统理论


3.1   区间二型模糊系统


只要一个模糊系统中使用了至少一个区间二型模糊集, 那么该模糊系统就称为区间二型模糊系统. 其结构如图7所示. 相对于一型模糊系统, 最大的区别是多了一个降阶器(Type-reducer) , 用来把推理机输出的区间二型模糊集转换成一型模糊集, 然后再进行去模糊化. 这是因为, 在Karnik和Mendel等最早提出的区间二型模糊系统中[47], 推理机的输出是一个区间二型模糊集, 不能直接进行去模糊化, 必须先转换成一型模糊集才行. 当然后来为了简化实现, 很多研究者也提出了各种方法来把推理机输出的区间二型模糊集直接映射为一个明确的输出, 即把降阶器和去模糊化合二为一.


AAS-CN-2020-0133-7.jpg

图 7  区间二型模糊系统

Fig. 7  Interval type-2 fuzzy system


考虑一个N条规则的区间二型模糊系统, 每条规则具有如下形式.


image.png


那么y为image.png, n=1,2,…,N.


其中image.png (i=1,…,I)为区间二型模糊集, image.png是一个区间, 可以理解为规则后件模糊集3的质心[62], 或者最简单的TSK模糊系统. 在很多应用中, 为了简单起见, 我们令image.png 也就是说, 规则后件退化为一个常数.


对于给定输入image.png, 区间二型模糊系统的典型计算过程为:

 

1)计算image.png上的隶属度区间, image.png


2)计算第n条规则的激活度区间, Fn(x′):


image.png


上式中使用了乘法t-norm. 也可以使用最小值t-norm.

 

3)进行降阶来融合Fn(x′)和对应的规则后件. 最常见的Center-of-sets降阶器[10]计算如下:


image.png


其中:

image.png


L和R被称为转换点, 满足如下不等式:


image.png


注意这里image.png都已经按升序排列. 具体地, yl和yr可以用下节介绍的KM算法[47]计算.

 

4)计算去模糊化之后的输出:


image.png


上述计算过程可以有很多变形. 比如, Sumati和Patvardhan[63]提出可以用输入区间二型模糊集和规则前件区间二型模糊集之间的互子集测度(Mutual subsethood)来计算规则激活区间, 并在多个机器学习和控制问题中验证了其性能.


3.2   KM算法


KM算法是区间二型模糊集中最经典、应用最广泛的算法.计算image.png的KM算法:


1)image.png (n=1,2,…,N)从小到大排序, 仍记为image.png,但是image.png对应调整Fn(x′)使其与排序后的image.png匹配.


2)初始化image.png


image.png


然后计算


image.png


3)寻找满足下列不等式的转换点k(1≤k≤N−1):


image.png


4)令


image.png


并计算


image.png


5)检查是否y′=y.如果是, 设置yl=y和L=k并退出. 否则, 令y=y′并返回步骤3).


计算yr的KM算法:

 

1)image.png从小到大排序, 仍记为image.png但是image.png对应调整Fn(x′)使其与排序后的image.png对应.


2)初始化image.png


image.png


然后计算


image.png


3)寻找满足下列不等式的转换点k(1≤k≤N−1):


image.png


4)令


image.png


并计算


image.png


5)检查是否y′=y.如果是, 设置yr=y和R=k并退出. 否则, 令y=y′并返回步骤3).



KM算法的基本思想是寻找image.png对应的转换点. 以image.png为例. image.png是Ycos(x′)的最小值. 因为image.png沿着图8 (a)的横轴从左向右逐渐增加, 对于左边的image.png 应该选取较大的权重(激活度区间的上界), 而对于右边的image.png, 应该选取较小的权重(激活度区间的下界). KM算法找到一个转换点L.对于n≤L,激活度区间的上界被用来计算image.png;对于n>L,激活度区间的下界被用来计算image.png.这样保证了image.png是最小值.


AAS-CN-2020-0133-8.jpg

图 8  转换点

Fig. 8  The switch points


3.3   降低区间二型模糊系统运算代价


上述KM算法是迭代式的, 没有解析解, 可能会妨碍对应的区间二型模糊系统在嵌入式等运算能力较低的系统中的运行. 近10年来人们提出了多种更高效的降阶和去模糊化算法, 让区间二型模糊系统更适用于实时或嵌入式系统.


根据Wu[64]的总结, 这些算法可以归为3类.


1)改进KM算法, 使其更加高效. 比如Wu和Mendel 于2009年提出的EKM算法[65], 在保证输出跟KM算法一致的基础上, 通过优化其初始化方法、循环迭代操作和迭代停止判据, 能节省至少39 %的运算代价. Wu和Nie[66]于2011年又提出了提出了更高效的EIASC算法. KM, EKM和EIASC算法都被包含在最新的MATLAB fuzzy logic toolbox中4.


2)跳过降阶器, 直接把推理机的输出映射到一个明确值. Wu和Tan[67]把每个模糊规则的激活度区间简化为一个激活度值, 为之前区间上界、区间下界和模糊系统输入的一个函数. 此后的运算就跟普通一型模糊系统的去模糊化操作一样了, 大大降低了运算代价. 后来, 人们又提出了更简单的BMM方法[68]、Nie-Tan方法[69]等.

 

3)使用更简化的区间二型模糊系统架构. Wu和Tan[34]提出只把模糊系统中最重要的部分, 比如控制器中对应于误差为0和误差变化率为0 (稳态附近)的输入范围, 用更稳定的区间二型模糊集建模, 其他输入范围还用简单的一型模糊集建模, 如图9所示. 这样能较好地融合区间二型模糊系统的鲁棒性和一型模糊系统的低运算代价.


AAS-CN-2020-0133-9.jpg

图 9  简化的区间二型模糊系统输入域中使用的模糊集示例

Fig. 9  MFs in a simplified interval type-2 fuzzy system


3.4   区间二型模糊系统优化


因为KM算法没有闭式解, 很难进行纯梯度下降法优化. 所以, 目前普遍使用进化算法进行区间二型模糊系统的优化. 区间二型模糊系统的进化算法优化主要有三种思路.

 

1)完全独立地优化一个区间二型模糊系统. 比如Wu和Tan[70]使用遗传算法独立地优化区间二型模糊系统, 并在双水箱液位控制中展示了其良好的性能.

 

2)两步法[32]: 先优化一个最好的一型模糊系统, 观察其性能是否满足要求; 如果是, 那么就不用再去寻找运算代价更高的区间二型模糊系统; 如果否, 那么用这个最优的一型模糊系统来初始化区间二型模糊系统, 然后再用进化算法来进一步优化.

 

3)同时优化一型和区间二型模糊系统. 因为一型模糊系统和区间二型模糊系统有一定相关性, Wu和Tan[71]在多任务进化算法中使用迁移学习思想, 让种群中最优的一型模糊系统和区间二型模糊系统可以相互利用对方的信息来进行更快更好的优化.


除了进化算法, 也有研究者结合梯度下降和最小二乘法或Kalman滤波法来优化区间二型模糊系统[72-75]. Deng等[76]提出了二型模糊极限学习算法, 随机初始化规则前件, 然后用极限学习机的思想来优化规则后件参数.


3.5   区间二型模糊系统性质研究


模糊系统的连续性对于在控制系统的稳定性非常重要. 一型模糊系统的连续性很容易保证, 只要论域中任意一点都被至少一个模糊集覆盖即可. 但是区间二型模糊系统的连续性很复杂, 存在一型模糊系统没有的性质. Wu和Mendel[77]发现, 当使用最常见的KM算法进行降阶时, 区间二型模糊系统可能出现两种不连续性: 间断不连续性和跳跃不连续性.


间断不连续性指的是论域中的一部分没有被任何一个模糊集覆盖, 所以当输入位于此区域时, 无法为其计算一个输出. 这是很容易理解的, 对一型和区间二型模糊系统都存在, 如图10第3列所示. x2的隶属度函数没有覆盖全部论域, 所以其对应的输出会产生间断.


AAS-CN-2020-0133-10.jpg


图 10  区间二型模糊系统的不连续性

Fig. 10  Discontinuity of interval type-2 fuzzy systems


跳跃不连续性为区间二型模糊系统所独有, 指的是当论域的某个部分只被上隶属度函数覆盖但是没有被任何下隶属度函数覆盖时, 当输入位于此部分的边缘时, 其输出会产生跳变, 如图10第2列所示. 当x2∈[−0.7,−0.4]∪[0.4,0.7], x1在−0.1或0.1时, 输出会产生跳变. Wu和Mendel[77]证明了当论域中的每个点都至少被一个下隶属度函数覆盖时, 就不会产生跳跃不连续性. 这在实际控制系统设计中是很容易满足的.


很多研究者也进行了区间二型模糊系统的鲁棒性或稳定性分析[78-83]. Lam和Seneviratne[78]最早使用李雅普诺夫方法对区间二型模糊系统进行了稳定性分析. 鉴于KM算法给区间二型模糊控制器稳定性分析带来的困难, Biglarbegian等[79]提出了新的闭式降阶算法, 并基于此进行了区间二型模糊控制器的稳定性分析. Kumbasar[81]对单输入区间二型模糊控制器进行了鲁棒性分析, 并用非线性控制理论解释了不确定覆盖域的作用. Xiao等[82]提出了三种对包含不匹配区间二型模糊集的多项式模糊系统进行稳定性分析的方法.


在实际应用区间二型模糊系统的建模过程中, 如果知道被建模对象的某些性质, 比如单调性, 那么区间二型模糊系统也应该具有单调性. Li等[84]研究了区间二型模糊神经网络的单调性, 给出了充分条件, 并提出了相应的优化算法. Li等[85]研究了单调区间二型模糊系统规则前件和后件应满足的充分条件, 考虑了五种不同的降阶和去模糊化方法. 其结果适用于不同形状的模糊集(如梯形、高斯形等), 也适用于一型模糊系统. Wang等[86]提出了构造单调的区间二型模糊非线性自回归(Nonlinear autoregressive exogenous, NARX)模型的方法并用于控制系统设计.


3.6   区间二型模糊控制器的解析结构


人们对PID控制器已经有了很深的理解; 相对而言, 对区间二型模糊控制器的理解要浅得多. 所以, 一个很直观的想法是: 能否把区间二型模糊控制器写成PID控制器的形式, 然后用PID控制器的思想来理解区间二型模糊控制器?


Wu等[87-89]最先进行了这方面的研究. 因为KM算法计算复杂且没有解析解, 而且之前的研究[34, 70]发现在控制问题中区间二型模糊控制器相对于一型模糊控制器的优势更多地体现在稳态状态附近, 所以Wu等着重分析了具有对称不确定覆盖域的区间二型模糊控制器在稳态附近的等价PI增益.


考虑图11所示的区间二型模糊PI控制器. 其规则为:


AAS-CN-2020-0133-11.jpg

图 11  区间二型模糊控制器的隶属度函数

Fig. 11  MFs of the interval type-2 fuzzy controller


image.png


其中image.png为输出控制量变换量, e为参考信号和实际信号之间的误差,image.png为误差变化量. 当图11中所有区间二型模糊都退化成图中粗虚线的一型模糊集时, 对应的一型模糊控制器是个线性PI控制器:image.png


当输入image.png满足如下条件时:


image.png


区间二型模糊PI控制器的输出为


image.png


其中


image.png


image.png 是等价比例增益,image.png是等价积分增益.显然, α和β都是image.png的函数, 即等价PI增益随输入image.png改变而改变. α总是小于1的; 当|image.png|较小时, 比如image.png, β也小于1. 所以, 对于稳态附近较小的输入或干扰, 区间二型模糊控制器的等价PI增益总是小于对应的PI控制器或一型模糊PI控制器. 同样的干扰导致的控制信号变动更小, 所以系统更不容易振荡.


因为image.png, 并且对于较小的image.png一般来讲image.png增加会降低α和β, 也就是说, 不确定覆盖域越大, 稳态附近的等价PI增益越小, 系统越不容易振荡.


对于具体的image.png,决定的输入区域如图12所示. 图13显示了α和β在图12所示的区域中如何随image.png变化.


AAS-CN-2020-0133-12.jpg

图 12  式(25)~(27)决定的输入区域

Fig. 12  Input region determined by (25)~(27)

AAS-CN-2020-0133-13.jpg

image.png


因为上面的解析分析能深刻揭示区间二型模糊控制器和经典控制器的异同, 人们进行了大量后续研究[90-94].


3.7   为什么区间二型模糊系统的性能可能比一型模糊系统好


在很多应用中, 我们都发现区间二型模糊系统的性能比一型要好, 但是其原因尚无定论. Wu[89]总结了如下几点:

 

1)区间二型模糊集可以同时建模个体内不确定性和个体间不确定性, 而一型模糊集只能建模个体内不确定性. 比如对于“高温”这个概念, 每个人都可以有一个一型模糊集(个体内不确定性) , 而不同人的一型模糊集往往是不一样的. 区间二型模糊集可以用来融合这些不同的一型模糊集, 从而考虑个体间不确定性.

 

2)实现相同的功能, 区间二型模糊系统需要的规则数会比一型模糊系统要少. 这使得基于专家经验的模糊系统建模更加容易. 即使模糊系统是通过数据驱动获得的, 更少的规则数也有助于模型的可解释性.

 

3)区间二型模糊控制器在稳态(误差和误差变化率都为0)附近控制面更加平滑, 这有助于提高其鲁棒性, 因为扰动带来的控制量的变化更小. 在实际实验中也观察到了区间二型模糊控制器稳态附近更平滑的控制面和更好的抑制振荡的能力[34, 70].

 

4)给定同样的规则数, 区间二型模糊系统能实现一型模糊系统不能实现的输入输出映射. 如果用一型模糊系统来复制区间二型模糊系统的输入输出映射, 那么一型模糊系统的某些隶属度函数的取值必须为负或大于1才行[89, 95], 而这在经典模糊集中是不可能的.

 

5)区间二型模糊系统具有一型模糊系统没有的新特性: 同一个模糊集的隶属度函数在不同规则中可以有不同的取值, 而一型模糊系统中同一个模糊集的隶属度函数在不同规则中的取值一定相同[89].


3.8   现实应用中设计一型和区间二型模糊系统的指导原则


一型模糊系统的设计和优化过程中有很多问题需要考虑, 比如: 使用单点还是多点模糊化? 对每个输入使用多少个隶属度函数? 是使用高斯隶属度函数还是梯形? 使用Mamdani还是TSK推理机制? 使用最小值还是乘积t-norm? 如何优化一型模糊系统?


区间二型模糊系统的设计和优化更加复杂. 除了考虑上面一型模糊系统中的问题, 还需要考虑: 输出处理需要使用降阶器吗? 如果使用的话, 采用哪种降阶方法? 如何优化区间二型模糊系统? 这些选择给了有经验的区间二型模糊系统设计者很大的自由度, 但是对初学者来说可能很困惑. Wu和Mendel[96]给出了图14所示的建议.


AAS-CN-2020-0133-14.jpg

图 14  对于区间二型模糊系统初学者的建议

Fig. 14  Recommendations on designing interval type-2 fuzzy system for beginners


同时, Wu和Mendel[96]澄清了区间二型模糊系统设计和应用中的两个误区:

 

1)通过把一型模糊集转换成区间二型模糊集, 从而把一型模糊系统转换成区间二型模糊系统, 就一定能够自动获得性能提升. 这是错误的. 区间二型模糊系统的参数一定要重新优化才行, 不是简单地给一型模糊集引入更多不确定性就好.

 

2)在确定的环境中设计好的区间二型模糊系统在未知环境中的表现一定比一型模糊系统好. 这也是错误的. 这有点类似机器学习中的泛化能力. 区间二型模糊系统具有更强的函数拟合能力, 但是也更容易过拟合. 所以一定要用更多样、更充分的数据来训练.


4.   区间二型模糊系统应用


4.1   控制


控制是区间二型模糊系统最广泛和最成功的应用[97]. 本小节简要介绍在单个系统和网络系统控制中的一些代表性工作.


单个物理系统的控制应用: Wu和Tan[32]用遗传算法优化区间二型模糊控制器进行双水箱液位控制, 并证实了区间二型模糊控制器比传统的一型模糊控制器更鲁棒. Hagras[98]进行了机器人在不确定环境下的自主运动控制, 证实区间二型模糊控制器能比一型模糊控制器能更好地处理不确定性. Liu等[99]提出了一种区间二型模糊切换控制系统来保证双足机器人行走时的步态稳定. Chaoui和Gueaieb[100]提出了针对具有弹性关节和结构性及非结构性动态不确定性的机械手的滑模区间二型模糊控制器. Lin和Chou[101]使用区间二型模糊神经网络实现了两轴运动系统的自适应精确控制. Martínez等[102]用遗传算法优化区间二型模糊控制器实现了单轮机器人的移动轨迹控制. Lin等[103]实现了多变量非线性系统的H∞


跟踪控制, 能有效处理训练噪声和外界干扰. 李成栋等[104]实现了柔索驱动并联机构的二型模糊神经逆控制. Abiyev和Kaynak[105]通过模糊聚类和梯度下降法优化区间二型模糊神经控制器进行线性时变系统控制. Biglarbegian等[106]实现了模块化、可重构机器人的实时区间二型模糊控制. Lam等[107]用一个区间二型模糊系统建模具有参数不确定性的被控对象, 并设计另一个区间二型模糊控制器进行控制. Taghavifar等[108]利用区间二型模糊神经网络实现了车辆座位的减震鲁棒控制. Li等[109]实现了受干扰非线性系统的区间二型模糊控制, 并保证了其闭环稳定性. Raju和Pillai[110]实现了风力发电机组的区间二型模糊控制, 能有效处理风速不确定性和电网扰动. Navarro等[111]用区间二型模糊系统减少了50 % 的硬盘数据拷贝延时. Huang等[31]实现了两轮移动小车上的倒立摆控制. Ren等[112]把区间二型模糊系统用于主动磁轴承系统控制, 实现快速稳定的悬浮. Wei 等[113]设计了区间二型模糊控制器来指导麻醉中的靶控输注.


网络系统的控制应用: Liang等[114]实现了宽带多媒体通信网络非同步传输模式的连接许可区间二型模糊控制. Li等[115]把区间二型模糊系统用于参数不确定的非线性网络控制, 并保证了其闭环稳定性. Zhao和Dian[116]实现了具有参数不确定、时变延迟和数据丢包的非线性系统的稳定控制. Tang等[117]实现了同时具有数据量化误差和丢包的非线性网络系统的输出反馈模型预测控制. Khooban和Gheisarnejad[118]实现了微电网的负载频率区间二型模糊控制. Hu等[119]实现了不确定非线性系统在网络物理攻击场景下的负载频率控制. Li和Ye[120]实现了非周期性拒绝服务攻击中的非同步自适应事件触发控制. Zhang等[121]实现了网络攻击中的安全区间二型模糊滑模控制.


4.2   机器学习


机器学习是区间二型模糊系统的另一个重要应用领域, 包括信号处理、特征选择、聚类、分类和回归等.


信号处理: Das等[122]提出了自整定的区间二型神经模糊系统来处理脑机接口中非平稳的脑电信号及其噪声. Herman等[123]使用区间二型模糊系统来处理试次内和试次间非平稳的脑电信号, 并在运动想象范式中做了验证. Singh等[124]利用区间二型模糊集来滤除灰度图中的椒盐噪声.


特征选择: Wu等[125]提出了区间二型模糊粗糙集并用于特征消减. Majiz和Garai[126]提出了区间二型模糊粗糙集和最大相关性最大重要性方法用于机器学习中的特征选择. Lin等[127]提出了一种区间二型神经模糊系统, 能同时去除无用的特征、不相关的规则前件和不相关的规则, 可用于系统辨识和特征选择. Chakraborty等[128]使用区间二型模糊集来进行脑电信号分类任务中的通道选择, 能同时处理试次内和试次间的脑电信号差异.


聚类: Hwang和Rhee[129]提出了基于区间二型模糊集的模糊聚类方法, 并在多个数据集上验证了其性能. Zhao 等[130]使用粒子群算法来优化自适应区间二型直觉模糊聚类并用于图像分割.


分类和回归: Zeng和Liu[131]结合了区间二型模糊集和隐马尔科夫模型进行语音识别, 证实其比传统隐马尔科夫模型效果更好. Subramanian等[132]提出了复数区间二型神经模糊系统及其对应的训练算法, 在多个分类问题中展现了良好的性能. Cao和Liu[133]提出了二型模糊主题模型(Topic model)用于人体动作识别. Juang和Wang[134]提出了融合区间二型模糊系统和支持向量机的算法并用于人身体姿态分类. Rubio-Solis和Panoutsos[135]受到模糊系统和径向基函数神经网络等价性的启发, 提出了区间二型径向基函数神经网络并用于多个分类和回归问题. Mo等[136]构建了一个基于区间二型模糊集的语义动力学系统并用于心理状态分析和干预. Kim等[137]提出了一种增强型的基于区间二型模糊聚类的分类器, 并引入L2正则化来降低过拟合. 该分类器在包括人脸识别在内的多个分类任务上显示了良好的性能. Eyoh等[138]提出了区间二型直觉模糊系统, 同时具有隶属度函数和非隶属度函数, 并用于辨识和预测. Cao等[139]把区间二型模糊集融合到模糊粗糙神经网络中, 并用于股票时间序列预测. Han等[140]对区间二型模糊神经系统在混沌时间序列预测中的应用做了综述.


演变(Evolving)区间二型模糊系统[72-75, 141]是目前研究比较多的区间二型模糊系统, 它能随输入训练数据的变化改变其结构和参数. 初始化时, 系统的规则库一般为空. 随着训练数据的增加, 新的规则被构造出来, 旧的规则被淘汰或合并. 演变区间二型模糊系统在很多机器学习分类和回归问题中展示了良好的性能.


5.   结论和展望


区间二型模糊集是经典的一型模糊集的推广, 能同时建模语义概念的个体内不确定性和个体间不确定性, 因而在决策和机器学习中得到了大量应用. 区间二型模糊系统是至少含有一个区间二型模糊集的系统, 在控制和机器学习中得到了成功应用.


尽管跟20年前相比, 区间二型模糊集和模糊系统的研究呈现出指数增长的趋势, 但是跟计算智能领域的其他方向, 特别是深度学习比较, 还有很大的发展空间. 以下是对未来研究方向的一些展望.

 

1)区间二型模糊集的重要应用是决策和机器学习. 在机器学习问题中, 模型在训练数据上优化, 其好坏可以很容易地用验证数据或测试数据来评价. 但是决策问题往往没有训练数据和验证数据, 很难比较不同决策方法的优劣. 目前常见的一个观点是, 区间二型模糊集比一型模糊集能更好地建模语义不确定性, 所以直观上讲其决策效果可能会更好. 但是这个观点说服力不够. 如果能够更客观地评价区间二型模糊集在决策问题中的性能和优势, 那么必然会促进其理论和应用的进一步发展.

 

2)区间二型模糊集和模糊系统的数学表达和理解比神经网络复杂很多, 不容易入门(本文在不影响理解的前提下刻意省略了其复杂的数学表达). 简化这些概念和表达能够吸引更多的研究者. Aisbett等[142]尝试用函数空间的术语和概念来表示二型模糊集, Mendel等[143]也对其最早提出的二型模糊集的定义和术语做了解释和改动, 但是仍然不够.

 

3)区间二型模糊系统的性能相比传统的一型模糊系统有提高, 但是相比神经网络, 特别是深度神经网络, 不一定有优势, 而且又不如神经网络那么容易处理大样本、高维度的数据. 受模糊系统和经典机器学习模型(如径向基函数神经网络、混合专家模型等)函数等价性[144]的启发, Wu等[145-146]把深度学习中的小批量梯度下降、DropOut、批规范化等操作引入到一型模糊系统训练中, 加快了训练速度, 提高了泛化能力, 并能有效处理大数据. 对应的工作应该也可以被推广到区间二型模糊系统.

 

4)深度学习的强大能力来源于其逐层堆叠的结构、层间特征的非线性变换和更高的模型复杂度[147]. 虽然区间二型模糊系统是万能逼近器[148-149], 即在规则足够多的时候具有很高的模型复杂度, 但是相对于深度神经网络, 区间二型模糊系统的结构非常浅, 内部也没有特征的非线性变换(模糊系统的输入一般都是原始特征). 有效构建深层区间二型模糊系统(比如层次区间二型模糊系统[98, 150]), 或者区间二型模糊系统与深度神经网络的结合[151], 可能是进一步提高其性能的可行方向.

 

5)相对于其他黑箱机器学习模型, 区间二型模糊系统的优点是可解释性. 这在完全依据专家经验进行建模的时候是尤其有用的. 但是现在随着数据驱动建模方法的流行, 模糊系统的规则也越来越多, 越来越复杂, 可解释性也大大降低了. 如何平衡区间二型模糊系统的性能与可解释性, 是一个值得研究的问题.

 

6)理论上讲, 一般二型模糊集和模糊系统比区间二型模糊集和模糊系统的建模能力更强[10]. 然而, 其理解更困难, 计算代价更高. 把区间二型模糊集和模糊系统的成果有效地推广到一般二型模糊集和模糊系统, 也是个有意义的研究方向.


参考文献:

2.png



https://blog.sciencenet.cn/blog-2374-1271237.html

上一篇:[转载]乘风破浪·勇创佳绩 | 青岛智能院召开2020年度高层管理人员年终述职会议
下一篇:[转载]【博览】2020封面故事,洞察产业发展,聆听西门子、ABB、台达、贝加莱……众位大咖精彩之声!
收藏 IP: 60.246.37.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 21:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部