浅谈粒度计算网(2)
2013-05-24 01:22
导读:4.2.研究的对象 商空间理论、粗糙集理论、词理论都将所讨论的对象的集合构成论域,但讨论对象之间的关系时,却各有不同。粗糙集理论的原型估计是由
4.2.研究的对象
商空间理论、粗糙集理论、词理论都将所讨论的对象的集合构成论域,但讨论对象之间的关系时,却各有不同。
粗糙集理论的原型估计是由关系数据库抽象而得的,故其模型为(X,F)(其中X是论域,F是属性集),即通过元素的不同属性值,来描述元素之间的关系,并用元素按不同属性进行的分类来表示不同的概念粒度。
商空间理论的原型是分层递阶方法,故其模型为(X,F,T)(其中X是论域,F是属性集,T是X上的拓扑结构)即除了元素的属性外,还引入元素之间的关系T(用拓扑来描述),从这个意义上来说,粗糙集理论是商空间理论的一个简单的特例。当然各自研究的着重点和侧重点不同。
当给定一个等价关系时,粗糙集理论认为是给定一个知识基,然后讨论任给的一个概念(集合)在这个知识基上如何被表示为知识基上集合之并,以及之间的关系。粗糙集理论主要利用集合的基数(元素个数)之间的关系,来描述概念之间的隶属关系,这样在一定程度上与模糊集概念联系起来。另外,粗糙集理论还讨论如何利用属性来最简单地表示所对应的知识基,这就是所谓“简约”问题。但因模型缺乏描述元素之间的相互关系的手段,故很难提取有结构论域中有关结构所提供的信息。当然结构在一定意义下也可以看成是元素的某种属性,但这种属性是多元属性(要用多元函数来表达),一般不能表示为f(x),而要用f(x,y,..)表示,如距离要用d(x,y)表示.
商空间理论着重点不同,它不是只针对给定的商空间(知识基)来讨论知识的表达问题,而是在所有可能的商空间中,找出最合适的商空间,利用从不同商空间(从不同角度)观察同一问题,以便得到对问题不同角度的理解,最终综合成对问题总的理解(解).它的求解过程是在“由所有商空间组成的半序格”中运动转换的过程.故可看成是宏观的粒度计算.而粗糙集理论是在给定的商空间中的运动,故可看成是微观的粒度计算.
词计算理论与商空间理论、粗糙集理论稍为不同,它主要研究(从粒度计算的观点来看它)如何描述由词界定的不同粒度的对象,它更擅长描述由形容词、副词表达的不同粒度的概念,如非常好、很好、好、很不错、还好,…等等. 因为这些词有程度不同的差别,故在一定意义下,词计算理论也给出了描述元素之间的关系,但只限于由属性的强弱程度不同所形成的关系.
从理论上说,将商空间理论、粗糙集理论看成是“精确”的粒度计算,那么都可在其模型上引入模糊的概念,得模糊的商空间理论,和模糊的粗糙集理论.
在[ZH2]中我们证明:模糊的等价关系,等价于在某个商空间上的归一等腰距离。即,可将它化成有结构的商空间。于是这三者都可统一地用多尺度的商空间理论来表示.如设商空间理论中原来的结构是一距离d
1(x,y),这个d
1是元素在空间”位置”关系的描述, 而由模糊概念引入的距离d
2,可以看成是元素之间的属性关系的描述.
属性是对元素个体性质的描述,而尺度是对元素之间关系的描述(当然也可看成是多元属性).
若属性值是取值于一个良序集上时,多可用模糊集来描述.
将三者有机地结合起来,对粒度计算将有重大意义。
4.3. 结构的重要性
最后阐述在粒度计算中结构的重要性,在问题求解时,人们多从一组前提出发,希望由它通过一系列的推导,得到结论。若将每个步骤用箭头相连,则得到由前提到目标的一条有向路。或更一般,问题求解可看成是在某有结构的空间中,求一条由前提到目标的有向路(或一条路径),于是当空间的结构是拓扑空间时,关于问题求解的解的存在性问题,就等价于在空间中回答“前提与目标是否处在同一线连通成份中”。而求解问题,就是在有解情况下,求从前提到目标的一条有向路径。
利用商空间中粗空间对细空间的“保假性”,(即:若问题在粗空间中无解,则在比它细的空间一定也无解)通过合理的分层递阶,可大大降低问题求解的复杂性。
我们对常遇到的结构如:半序结构、距离结构以及一般拓扑结构,其对应的商空间的构成及不同商空间的综合都给出有效的构造性的算法。
对什么情况下分层递可以降低计算复杂性,能降低多少等,我们在[Z1]中也进行了详细地论述。
在[ZH3]中还把统计推断方法引入商空间模型,为多层信息综合、不确定推理、定性推理等,建立数学模型和相应算法,有效降低了计算复杂性。
有结构的模型在实际问题求解中是经常遇到的,如地理信息中其地理位置之间的关系就是一个距离结构;在数据仓库中各数据之间的关系可用半序来描述,它也是一种结构;又在路径规划中对象所处空间的位置关系,就是一种距离的结构;在数据挖掘中的规则发现,所有的规则全体按其包含关系就构成半序结构等等。在这些有结构的对象中进行问题求解利用基于商空间理论的粒度计算将是很有效的。
商空间的方法与目前流行的“粗糙集”方法相同之处在于:都是利用等价类来描述“粒度”,都是用“粒度”来描述概念。但讨论的着重点有所不同,我们的着重点是研究不同粒度世界之间的互相转换、互相依存的关系,是描述空间关系学的理论;而目前的粒度计算(如粗糙集理论等)主要是研究粒度的表示、刻划和粒度与概念之间的依存关系。更主要的不同在于:我们的理论是在论域元素之间存在有拓扑关系的情况下进行研究的,即论域是一个拓扑空间,而现在的粗糙集理论,其论域只是简单的点集,元素之间没有拓扑关系(只是商集理论,而不是商空间理论),故它们讨论的是无结构的特殊情况。
另外,粗糙集是在给定的知识基上求解对应的问题,如求集合的R-上近似和R-下近似,我们是在(
X,T)中讨论各商空间之间的关系,求相应的(各种意义下)上近似空间和下近似空间。从这个角度看,可以说粗糙集是微观的粒度计算,商空间理论是宏观的粒度计算。这两个理论都是建立在等价关系之上,所有可以将两者结合起来。
Zadeh 所讨论的粒度计算与Pawlak和我们所讨论的粒度问题又有些不同,他主要是讨论粒度的表示问题,他们认为人类是用语言进行各种思考和推理的,不同的词就表示不同的粒度,那么如何表示它们呢?一般来说用“语言”、“词(word)”来表示的概念,牵涉到“词计算”问题。而词计算,现在最流行的方法是“模糊数学”的方法,于是他得出的结论是:模糊数学应是粒度计算的主要工具之一。
依Zadeh的看法,Pawlak和我们讨论的粒度是“清晰的粒度”,而他自己讨论的是“模糊粒度”。
如何将模糊集的方法引入商空间理论中来,这可从几方面着手进行,一是在论域X上引入模糊集;二是在结构T上引入模糊拓扑结构;三是对我们的核心概念等价关系,引入模糊概念。
以上简单介绍了商空间理论、词计算理论、粗糙集等粒度计算方法之间的关系。可以看出这三个不同的粒度计算理论,从思考问题的出发点和解决问题的任务,都不尽相同,各有千秋。但是三者都有一个共同的特点,那就是都考虑到人类智能中,有从不同粒度思考问题的这一特点。如何将三者的优点结合起来,形成更强有力的粒度计算的方法和理论,是今后一个重要的研究课题。一个明显可进行的研究是:将商空间理论与粗糙集方法相结合,或说将粗糙集方法引入商空间理论中来,或说在商空间理论中同时讨论微观的粒度计算问题,将微观和宏观的粒度计算统一起来,构成一个更加完整的粒度计算理论和方法,将会更有效的。
[P1] Z. Pawlak, Rough Sets Theoretical Aspects of Reasoning about Data, Kluwer Academic Publishers, Dordrecht, Boston, London, 1991.
[Y1] Y. Y. Yao, Granular Computing: basic issues and possible solutions. Proc. of fifth Joint Conference on Information Sciences, Vol.I, Atlantic City, New Jersey, USA, 2000:186-189.
[Y2] Y.Y. Yao, and X. Li, Comparison of rough-set and interval-srt models for uncertain reasoning, Fundamental Informatics, 27,1996:289-298.
[Y3] Y.Y. Yao and Ning Zhong, Granular Computing Using Information Table, in T.Y. Lin, Y.Y Yao, and L. A. Zadeh (editors) Data Miming, Rough Sets and Granular Computing, Physica-Verlag, 2000:102-124.
[ZA1] L. A. Zadeh, Fuzzy logic=computing with words, IEEE Transactions on Fuzzy Systems, 4, 1996:103-111.
[ZA2] L. A. Zadeh, Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic, Fuzzy Sets and Systems, 19, 1997:111-127.
[ZA3] L. A. Zadeh, Announcement of GrC, 1997,
[ZH1] 张钹,张铃《问题求解的理论及应用》,
清华大学出版社,1990)(版. Bo Zhang and Ling Zhang, Theory and Application of Problem Solving, North-Holland, Elsevier Science Publishers B.V. 1992)
[ZH2] 张铃 张钹 模糊商空间理论(模糊粒度计算方法)“软件学报”,14(4)2003:770-776.
[ZH3] Zhang Ling,Zhang Bo,Statistical Genetic Algorithm, Chinese Journal of Software Vol.8,No.5:335-344(张铃,张钹,统计遗传算法《软件学报》8(5),1997:335-344。