可拓集合的分类性质和信息开发的可拓方法
何 斌1,张应利2
α
(1.广东工业大学物元分析研究所,广东广州510090;21广东工业大学工商管理系,广东广州510090)
摘要 分类是认识事物的基础,而信息开发则是信息利用的前提.本文研究了可拓集合中的分类思
想,分析了可拓集合的分类性质(包括分类的可转化性、动态性、临界性和相对性),介绍了信息开发的可拓方法.
关键词 可拓集合;分类;信息开发;可拓方法
ClassificationPropertiesofExtensionSet
andExtensionMethodofInformationExploitation
HEBin,ZHANGYingli
(GuangdongUniversityofTechnology,Guangzhou510090)
Abstract Classificationisthebasisofunderstanding,andinformationexploitationisaprerequisiteforinformationuse.Thepaperstudiesthepartitionideologyofextensionset,analysestheclassificationpropertiesofextensionset(includingthetransferability,dynamicproperty,criticalityandrelativityofclassification),whichshowsthattheclas2sificationcharacteristicsofextensionsetarekeypointsforsolvingnon2compatibleprob2
.Andthenwepresenttheextensionmethodofinformationexploitation,whichislems
aneffectivemeanstoobtaincreativeinformation.
Keywords extensionset;classification;informationexploitation;extensionmethod
1 引言
首先,分类是认识事物的基础,合理的分类是进行查询、检索、决策和控制的必要条件.要解决不相容问题[1~3],按现有的各种分类方法(包括经典数学分类方法、模糊数学分类方法、粗糙集分类方法)是无法实现的,因为它们都无法描述“是”与“非”的转化过程、无法描述“不相容”向“相容”转化的过程.本文分析了可拓集合[1~3]中关于研究对象的分类思想和分类性质,指出可拓集合中的分类特性是可拓集合适于求解不相容问题的重要契机.
其次,信息开发是信息利用的前提[4,5],能否拥有充分的信息资源,是“一般解题”能否实现的关键之一.由于不相容问题解题是人脑“出点子、想办法”的思维活动过程,它比“一般解题”更富于创造性,不仅要求具备充分的原始信息,而且更强调人脑从原始信息中获取创造性信息的能力.本文研究了信息开发的可拓方法,指出了信息物元的可拓性是获取创造性信息的有效途径.
本文的探讨仍是初步的,深入的研究对不相容问题解题的程序化探讨和相应的专家系统[6]开发,对用计算机模拟人脑解决不相容问题,甚至对可拓学[3]在人工智能等相关领域的应用,都具有重要价值.
α收稿日期:1998212214
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
64
2 可拓集合的分类性质
系统工程理论与实践1999年7月
所谓分类,就是对研究对象集进行子类划分.分类是认识事物的基础,合理的分类是进行识别、检索、决策和控制的前提.本节对分类的研究主要讨论元素与其子类之间的隶属关系及其变化性质,重点不是通常所关心的子类之间的相关关系.分析可拓集合中对象的分类性质,有助于深刻理解可拓集合中的分类思想,从而有助于利用可拓集合的分类方法对研究对象进行合理分类.本文所讨论的分类性质包括以下四个方面:1)分类的可转化性;2)分类的动态性;3)分类的临界性;4)分类的相对性.
211 分类的可转化性
记
A={(u,y)u∈U,y=k(u)}
表示给定的可拓集合,其中U为论域,k(u)为关联函数,则
A={uu∈U,k(u)Ε0},ϖA={uu∈U,k(u)Φ0},
分别为可拓集合A的正域和负域,即对于正域中的元素其关联函数值是非负的,而对于负域中的元素其关联函数值是非正的.
可拓集合分类的可转化性体现在可拓域的概念中.对于给定的变换T,
A+(T)={uu∈U,k(u)Φ0,k(Tu)Ε0}
A
-
(T)={uu∈U,k(u)Ε0,k(Tu)Φ0}
分别称为可拓集合A关于变换T的正可拓域和负可拓域(二者统称为可拓域).可拓域的概念揭示了在一定的变换下,元素的正负属性是可变的,正域中的元素可转变为负域中的元素,而负域中的元素可转变到
0.1
正域中来.例如,某车床加工的工件规格为50+m,若对加工后的工件进行检验,可分为合格品和不合-0.1c
格品;而在不合格品中,一类是直径dΕ50.1cm的工件,一类是直径dΦ49.9cm的工件.现在考虑“车床重新加工”的变换,记为T.前者虽然不合格,但是经过变换T,可以变为合格品,而后者在变换T下,不可能变为合格品.我们通常把前者称为可返工品,后者为废品,显然二者是本质不同的不合格品.可拓域揭示了事物“是”与“非”或“此”与“彼”相互转化的可能性,可以用来定量地描述事物质变的过程.我们把元素属于正负域的可变性称为分类的可转化性.显然,可拓集合中分类的可转化性与元素变换T的选择有关,变换T不同,所产生的可拓域也不同,从而导致不同的集合分类.比如,在刚才提到的工件加工的例子中,如果考虑“电镀加工”变换,则直径dΦ
49.9cm的工件反而是可返工品,而直径dΕ50.1cm的工件则是废品.这表明“车床重新加工”的变换和
“电镀加工”变换所对应的可拓域是不同的.
对于元素为物元的可拓集合(即物元可拓集合):
A(R)={(R,y)R∈U,R=(N,c,v),y=k(R)},
可拓域中的变换可以是关于事物的变换,也可以是关于特征的变换或量值的变换,还可以是三者的组合形式.而每种变换又可以是置换、增删、扩缩和组分四种基本变换或它们的组合形式.例如,在“曹冲称象”的
故事中,从“可分性”来考虑,“大象”是负域中的元素(其k(u)Φ0),但经过事物的变换T(即把大象换成等重的石头)后,成为正域中的元素(其k(Tu)Ε0).
分类的可转化性表明,在管理、决策和控制过程中,对正负域中的不同元素其处理方法应有所不同:1)对在正域中但与目标有误差的元素,可以利用现有的各种方法进行反馈调整或处理,以期达到预期的目标.
2)对在负域中,但仍可以转化到正域中的元素,可以先进行一定的元素变换或物元变换,使之转化到正域,再利用现有的各种方法进行反馈处理.
用产生式形式以上两点可表示为:
1)IFk(u)Ε0THEN作常规反馈处理.
2)IFk(u)Φ0THEN作元素变换(或物元变换)T,使k(Tu)Ε0,ANDTHEN作常规反馈处理.212 分类的动态性
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
第7期可拓集合的分类性质和信息开发的可拓方法65
分类的动态性是指分类的过程必须考虑时间因素的变化.记
A(t0)={(u(t0),y)u(t0)∈U,y=k(u(t0))}
为时刻t0的可拓集合,则
A+(t)={u(t0)u(t0)∈U,u(t)∈U,k(u(t0))Φ0,k(u(t))Ε0}A-(t)={u(t0)u(t0)∈U,u(t)∈U,k(u(t0))Ε0,k(u(t))Φ0}
(t0)关于时刻t的正可拓域和负可拓域.分类的动态性是由于事物随时间的变化所产分别称为可拓集合A
生的,这种变化可以是自然变易(即事物自然演化)引起的,也可以是人工变易(即人工参与引起的).
213 分类的临界性
为了深入分析事物的质变过程,可拓集合没有沿用传统经验中对论域“一分为二”的分类模式,提出了“一分为三”的新模式.在可拓集合
A={(u,y)u∈U,y=k(u)}
中,按关联函数k(u)的符号值,论域U被分成三个基本部分:
A={uu∈U,k(u)Ε0},ϖ={uu∈U,k(u)Φ0},A
J0(A)={uu∈U,k(u)=0}
分别称为可拓集合的正域、负域和零界.显然,零界是正域和负域的交集,这表明零界中的元素具有正域的性质,也具有负域的性质,反映了事物质变过程中的临界状态.换句话说,一个元素如果不能严格地划分为
(既在屋子内又不在屋子内、“是”或“非”,则可归入零界,零界元素描述了诸如“跨在门槛上的人”“一个标准大气压下0℃的H2O(即是冰又是水)这样一类“既是又非”的临界过渡事物.
零界的划分与可拓集合中“允许元素u具有性质P,又不具有性质P”的造集原则是一致的.我们把从正域和负域中分离出零界的性质,称为分类的临界性.
214 分类的相对性
从一维可拓集合的角度来看,对同一个论域和给定的同一个变换而言,不同的关联准则(即关联函数)所做出的正负域划分、正负可拓域划分通常是不一样的.也就是说,论域的划分关于关联准则具有相对性.
从多维可拓集合的角度来看,对于不同的关联准则,元素的正负属性具有可变性;即对于关联准则
k1(u)为负(或正)的元素,对于关联准则k2(u)有可能为正(或负),这是因为不同的关联准则可能是从事物不同的特征方面进行考虑的.比如,某人的“技术能力”很强(相应的k1(u)>0),但“组织能力”可能很弱(相应的k2(u)<0).
为了进一步考察可拓集合的相对性,我们考虑二维可拓集合
B={(u,y1,y2)u∈U,y1=k1(u)≡0,y2=k2(u)},
是零界可拓集合.如前一样,我们亦可按关联准则k2(u)把论域U“一分为这里关于关联准则k1(u)而言,B三”:
B={uu∈U,k1(u)=0,k2(u)Ε0},B={uu∈U,k1(u)=0,k2(u)Φ0},
ϖ
可进一步划分为正域、也就是说,按关联准则k2(u),集合B负域和零界.这种划分揭示了事物划分的相对
性和变化性,表明按一种规则(关联准则)划分属于零界的元素,按另一种规则划分则可能属于正域或负域.若记Tk1(u)=k2(u),即T是关于规则的变换,则以上三式又可表示为:
B={uu∈U,k1(u)=0,Tk1(u)Ε0},ϖB={uu∈U,k(u)=0,Tk(u)Φ0},
1
1
J0(B)={uu∈U,k1(u)=0,k2(u)=0}.
J0(B)={uu∈U,k1(u)=0,Tk1(u)=0}.
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
66系统工程理论与实践1999年7月
为模糊集合,但关于关联准则k1(u)而言, 特别地,若令k2(u)∈(0,1),则关于关联准则k2(u)而言,B
.B为零界集合
3 信息开发的可拓方法
随着大量的大规模的数据库迅速不断地增长,人们对数据库的应用已不满足于仅对数据库进行查询和检索.仅用查询和检索常常不能提取有利于用户实现目标的有用信息[4~5].这样,数据库中蕴藏的丰富信息就得不到充分的发掘和利用.结果是,一方面大量信息被闲置和浪费,成为信息垃圾;另一方面,用户要实现的目标又因缺乏必要的信息而无法解决.因此,如何进行信息开发,从数据库的原始数据中,开拓出有用的信息,这是一个十分重要的课题.在这方面,信息开发的可拓方法是个有益的探索.信息开发的可拓方法包括信息开发的发散性方法、蕴含性方法、可扩性方法、共轭性方法、相关性方法等.它们源于物元的可拓性[2,3],即物元的发散性、蕴含性、可扩性、共轭性和相关性.有学者认为,物元可拓性理论可以支持以信息和知识的内在联系为基础的知识表示[7].本节主要介绍信息开发的发散性方法和蕴含性方法.
311 信息开发的发散性方法
物元可拓性方法中的发散性方法,是信息开发的有效方法之一.
可拓学认为,信息可用物元表示,称为信息物元[7].例如,信息“某甲是一名教授”,可表示为信息物元 R=(某甲,职称,教授).再如,信息“电动机正在高速运转”,可表示为R′=(电动机,操作状态,正高速运转).这里值得一提的是,信息物元与记录是可以相互转换的.对于从数据库中抽取出来的记录,我们可以先把它转换为一维物元或多维物元,然后再利用物元发散性方法进行信息开发.
物元发散性方法包括“一物多征、一征多物、一征多值、一值多物、同物同征、同征同值、同物同值”等多种发散方法.我们通常把用发散性方法得到的信息叫发散性信息.
所谓“一物多征”,是指“一个事物有多种特征”,它启发人们:若仅考虑事物的当前特征元无法解决问题时,可以考虑该事物的其他特征,因为一个事物具有多种特征.例如,我们都知道纸张具有“书写功能”,有“可书写性”,但如果我们的目的是“包西药粉末”,则“纸张具有可书写性”的信息是个无用信息.然而,若从这个信息出发,利用“一物多征”,可考虑与纸张的包装功能相关的“纸张的可折叠性”,从而可用纸来包东西、包粉末,这样问题就解决了.若记R1=(纸张,可书写性,a),R2=(纸张,可折叠性,b),则R2为R1的“一物多征”发散性信息.
再如,“一征多物”是指“一个特征可被多个事物所具有”.这个发散性方法在价值工程上有重要价值.二次世界大战之后,美国防火用的石棉板(即防火板)短缺,而且价格甚高,当时在采购部门工作的工程师麦尔斯便用具有同样功能但价格很便宜的防火纸代替,结果不仅解决了防火问题,而且节省了一大笔资
(即同功能的事物不是唯一的)发散性方法.其实,“具有防火功能”金.这里使用的就是“一征多物”的事物除防火板和防火纸外,还可以是防火帆布、防火涂料等.若记R3=(防火板,防火功能,c),R4=(防火纸,防
火功能,d),R5=(防火帆布,防火功能,e),R6=(防火涂料,防火功能,f),则R4、“一征多R5和R6为R3的物”发散性信息.
“一物多征”发散性方法所得的发散信息集是同物物元集(又称同物信息集),在物元空间中是同物物元面;“一征多物”,所得的发散信息集是同征物元集(又称同征信息集),在物元空间中是同征物元面.它们的发散树结构如图1和图2所示.
— R1=(N,c1,v1)
R=(N,c,v)
一物多征
— R2=(N,c2,v2)—
— Rn=(N,cn,vn)
图1
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
第7期可拓集合的分类性质和信息开发的可拓方法
— R1=(N1,c,v1)
R=(N,c,v)
67
一征多物
— R2=(N2,c,v2)—
— Rn=(Nn,c,vn)
图2
值得一提的是,根据发散性进行信息开发时,其开发过程并不是漫无目标进行的,而是具有一定的选择性和方向性的.以“一物多征”为例,从理论上讲,“一个事物可以有无穷多个特征”,因而从一个信息物元出发可以随意开发出无穷多个信息物元,但实际上这样开发的信息是无意义的,还会产生“信息爆炸”问题.“一物多征”的本质是“特征的发散”,因此具体进行“一物多征”发散时,通常可以考虑对发散特征作以下限定性处理:
1)限定发散特征的有限发散域U,即发散特征限制于有限特征域U内.如果在信息开发过程中发现初始域U太窄,无法包容有价值的开发信息,还可以动态调整论域U.
2)发散特征是已知特征的上位或下位蕴含特征.
3)发散特征是已知特征的相关特征.
4)发散特征是与期望目的或期望功能相关的实义特征或性质特征.
物元发散性方法中的其他发散性方法此不赘述,参见文献[2,3].归纳抽取和演绎抽取(分别通过归纳推理和演绎推理实现)是常规的信息开发方法[4,5],与这两类信息开发方法相比,信息开发的发散性方法具有独特的特点.归纳方法和演绎方法本质上都是从多点(信息)到一点(信息)的信息开发模式,而信息开发的发散性方法则是从一点(信息)到多点(信息)的信息开发模式.确切地说,它是从点到线、从点到面的信息开发模式,它为用户要实现的目标提供了可供选用的丰富备择信息,具有创造性开发的特征.对用户实现目标有用的发散信息就可能蕴藏在这些发散信息中.当然,有用的发散信息还必须经过一定的收敛评价方法[2,3]进行筛选才能得到.312 信息开发的蕴含性方法
从己知信息物元出发,利用信息物元的蕴含性进行开拓所得到的物元信息,称为已知信息物元的蕴含信息.这些蕴含信息所形成的蕴含关系图,称为信息蕴含系.我们把从已知信息物元出发,利用信息物元的蕴含性获得信息蕴含系的方法,称为信息开发的蕴含性方法.
例如 记 R=(打印机D的进纸指示灯E,显示状态,闪烁) 为已知信息物元,则
R](打印机D,出纸状态,缺纸)
再如,在间谍小说中常看到这样的情节,某人在报刊上登广告“母亲病重,速回家”,表面的信息是告知某人“母亲病重,请速回家看望母亲”,但是这信息只是载体,经双方约定的密码内容来通信.“病重”是革命组织被破坏,“回家”是千万不要曝光,去安全之所.这里,若记
r1=(母亲F,健康状况,病重)
r2=
(革命组织G,组织状况,被破坏)
则r1]r2
一般地,设r1和r2是给定的信息物元,若r1]r2,则称r1为r2的上位信息物元,r2为r1的下位信息物元.从已知信息物元出发,利用信息蕴含系方法,依据信息物元的上位信息物元和下位信息物元进行开拓,即可获得关于已知信息物元的蕴含系.
例如 记 R0=(房间H的电灯,照明情况,不正常)为已知信息物元.考虑R0的上位信息物元,则可得
R0]R1∧R2
R1=R2=
写论文,缝衣服,
光线条件,地点,光线条件,地点,
光线不足房间H光线不足房间H
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
68系统工程理论与实践1999年7月
考虑R0的下位信息物元,则可得 R3∨R4]R0,其中
R3=(房间H电灯钨丝,功能状态,被烧断)R4=(房间H电源保险丝,功能状态,被烧坏)这样可得一个简单的信息物元蕴含系:
R3R4
or]R0] ○
R1R2
用蕴含性方法开发利用信息的作用主要表现在如下几个方面:
1)开发事物的“因果关系”信息,使人们不仅能“知其然”,还能“知其所以然”,其依据是“原因]结果”的蕴含性.
2)开发事物的“手段2目标”信息,使人们可以利用目的变通的方法解决不相容问题,其依据是“手段]目标”的蕴含性.“围魏救赵”就是采用这种蕴含性解决问题的.3)挖掘事物变化的传导效应或传导信息,其依据是“主动变换]传导变换”的蕴含性.4)开发事物的“局部2整体”信息,分析事物的层次结构关系或种属关系,其依据是“整体]局部”的蕴含性.
5)由表及里,由外及内,透过信息的表面涵义,获取信息的深层含义,获取信息背后的信息,从而为人
们认识分析事物的本质奠定基础.
参考文献[1] 蔡文.可拓集合和不相容问题.科学探索学报,1983,3(1):83~97
[2] 蔡文.物元模型及其应用.北京:科学技术文献出版社,1995[3] 蔡文,杨春燕,林伟初.可拓工程方法.北京:科学出版杜,1997[4] 史忠植.高级人工智能.北京:科学出版杜,1998
[5] 胡继武.信息科学与信息产业.广州:中山大学出版杜,1995:107~169
[6] 李健,王行愚.一种新型的专家系统——可拓专家系统.华东化工学院学报,1993,19(5):617~623[7] 刘巍,张秀芳.基于可拓信息的知识表示.系统工程理论与实践,1998,18(1):104~107
(上接第62页)
参考文献
[1] 程士德主编1内经讲义1上海:上海科学技术出版社,1984[2] 印会河主编1中医基础理论1上海:上海科学技术出版社,1984[3] 尚志钧,翟双庆等整理1中医八大经典全注1北京:华夏出版社,1994
[4] 管小思,智能模拟原理浅析1哲学研究,1986,7:62~68(转载:《,1986,8:37~43中国人民B3逻辑》
大学全国报刊资料选汇.)
[5] 管小思.太极科学体系和生命起源观分析.亚洲医药,1996110(增刊):320~325[6] 管小思.情绪分类的序模型及其中医学解释.亚洲医药,1998,1:72~73
[7] 管小思.中医学仿生模型在复杂智能系统控制中的应用.中国控制会议论文集,1997:923~930
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容