模糊概念格模型及其应用研究解读(全文)

下面是小编为大家整理的模糊概念格模型及其应用研究解读(全文),供大家参考。

模糊概念格模型及其应用研究解读(全文)

 

 上海大学 博士学位论文 模糊概念格模型及其应用研究 姓名:强宇 申请学位级别:博士 专业:控制理论与控制工程 指导教师:刘宗田 20051201 上海大学博士学位论文 摘要。

 随着计算机技术的飞速发展,数字信息与日剧增,信息存储和处理任务越来越艰巨和困难,因此,对信息表示和处理的研究具有非常重要的意义。在实际应用中,信息多是模糊的、不确定的,故模糊信息的表示及处理研究具有重要的实用意义。

 作为一种优良的数学工具,概念格已经广泛应用于知识表示、数据挖掘、信息检索等许多领域。在多数文献中,概念格的研究是基于标准形式背景的。但在实际中,信息多是模糊的、不确定的。目前关于模糊信息的研究方法多数是基于有限的L模糊集合的,即基于离散数值的模糊集合,无法表示连续数值的模糊信息。

 本文所作的工作是将模糊理论与形式概念分析结合,研究了基于连续数值模糊集合的模糊概念格模型及在知识发现中的应用。

 本文的主要工作和研究成果具体是

 1.提出了一种模糊概念格模型,该模型基于连续数值模糊集合,具有更广泛的应用。在模糊概念格的节点级上,定义了两个模糊参数E和6,分别是概念的外延中对象的平均隶属度和对象的隶属度值相对平均隶属度的偏离程度。

 2.提出并实现了一种用渐进式方法构造模糊概念格的算法,在该算法中采用了保留中间结果kd、11d的方法渐进式计算模糊参数E、6,使之不需要回到初始背景中计算。

 3.提出了基于模糊概念格的模糊关联规则的提取方法与算法,其中利用模糊参数6,可以避免生成非健壮节点对,从而防止生成效果欠佳的规则,实验并分析了算法的有效性和时空复杂度。

 4.针对模糊概念格构造的巨大的时空复杂度问题,将分布式处理的思 想引入模糊概念格,提出了分布式模糊概念格的模型,并且基于模糊概念子格的并运算,提出并实验分析了分布式构造模糊概念格的算法。此算法比未采用分布处理在时空复杂度上有很大改进。

 —唯弼瑁霹秆擎基虿可窥焉砭玎———一 国家自然科学基金(60575035)I围寡自然科学草台(曲985004)

 上海大学博士学位论文 5.提出了采用模糊聚类技术和聚类参数从模糊概念格生成模糊聚类、构造模糊概念层次、进而采用映射构造模糊本体的方法,并给出了实例。

 关键词:模糊形式概念分析,模糊概念格,模糊关联规则,分布式模糊概念格,模糊聚类,模糊本体。II 上海大学博士学位论文

 ABSTRACT Withtherapiddevelopmentofcomputerscience,andtherapidincreaseofdigital storageandprocesstaskismoreandmoredifficult,so oninformationrepresentationandprocesshasveryimportantsignificance.In isfuzzyandindeterminate,soresearchonfuzzyinformation andtransactionhasextremelyimportantsignificanceintheoryand Asakindofexcellentmathematictool,ConceptLatticehasbeenwidelyappliedin representation,dataminingandmanyotherfields.Itlmostpapers,Concept isbasedonstandardcontext,butinpractice,informationisusuallyfuzzyandAtpresent,mostofresearchmethodsonfuzzyinformationarebasedonL_fuzzyset,theyCall’tprocessthefuzzyinformationofconsecutivevalue. Inthedissertion,wecombinefuzzyinformationwithConceptLattice.researchthefuzzyconceptlatticemodelbasedoncons

 ecutivevalue,andstudyit'sapplicationinknowledgediscovery. Themainworkandresearchresultsinthisdissertionareasfollows 1.WepresentamodelofFuzzyConceptLattice,thismodelisbasedonfuzzysetofconsecutivevalue,SOithasmorewideapplication.Atthenode1evelofFuzzyConceptLattice,weintroducetwofuzzyparametersEand6,whichalerespectivelymeanvalueofmembershipdegreeoftheobjectsinextentofthefuzzyconceptanddeviationdegreeofmembershipdegreeoftheobjectsforthemeanvalue. 2.WepresentandimplementanalgorithmforgeneratingFuzzyConceptLatticeThisworkissupportedbytheNational111 NarealScienceFoundationofChina(60275022),(60575035)and(69985004)information,informationresearchapplication,informationrepresentationapplication.knowledgeLatticeindeterminate. 上海大学博士学位论文 byincrementalmethod.Inthisalgorithm,weemploytwointermediatevariablesto

 computefuzzyparametersEand8incrementally,SOthatweneedn’ttoreturnintotheinitialcontexttocomputethem. 3.WepresentamethodandanalgorithmforfuzzyassociationruleextractionbasedonFuzzyConceptLattice.Inthemethodweapplyfuzzyparameter8toavoidcreatingnon-robustnodeparis,andthusavoidcreatingimpotentrule.Anexperimentiscompleted,andtheeffectandtime—spatialcomplexityofthealgorithmisanalysed.4.Consideringthelargetimeandspatialeomplexityoflatticeconstruction,weintroducethethoughtofdistributedprocessintoFuzzyConceptLattice,presentamodelofdistributedFuzzyConceptLattice,andtheunionoperationbasedonFuzzyConceptSub-Lattice.AnexperimentforanalgorithmofDistributedgeneratingFuzzyConceptLatticeiscompletedandresultsisanalysed.Theresultsshowthatthealgorithmissuperiortothosealgorithmswithoutdistributedprocessontime—spatialcomplexity. 5.WeapplyfuzzyclustertechniquesandthefuzzyparameterstocreatefuzzyclusterfromFuzzyConceptLattice,constructfuzzyconcepthierarchy,andapplymapping

 methodtoconstructfuzzyontology.Anexperimentalcaseandanalysisaregiven. Keyword:fuzzyconeeptlattice,fuzzyparameters,fuzzyassociaterule,distributedfuzzyconceptlattice,fuzzycluster,fuzzyontology. 上海大学博士学位论文 第一章绪论 1.1.课题研究的目的和意义 在实际中大量信息是模糊的、不确定的,模糊信息的表示和处理有很好的应用背景。本文将模糊引入概念格,针对以往模糊信息研究大多是基于离散的模糊集合的局限,定义了一个广义的模糊概念格模型,并研究了模糊信息的表示和处理以及在数据挖掘中的应用,包括模糊与概念格的结合、模糊概念格构造、模糊关联规则提取、模糊概念格的分布式构造、模糊与本体的结合、基于模糊概念格的聚类技术、模糊本体的生成方法等。

 本论文工作属于国家自然科学基金项目“基于Rough集合理论的概念格结构模型研究(69985004)”、“分布式概念格数学模型与算法研究(60275022)”和“面向本体的形式概念分析扩展模型与算法(60575035)”中的内容,并得到上海市高等学校青年发展基金(03AQ99)的资助。

 1.2.国内外研究概况 随着计算机发展,人们处理的信息量与日剧增,在实际中不确定的、模糊的信息越来越多,如年龄为30岁的人可以划归青年人的集合,也可以划归中年人的集合。关于模糊信息的表示与处理有很实用的研究背景。美国人扎德最早提出了模糊集理论并应用于模糊控制中,提出了隶属度的概念。关于模糊信息的表示有Kar

 lErichWolff的模糊信息表示法[37】、Bumsco的L模糊集法[38】、Girard的模糊量词集法[39]【40]等。在KarlErichWolff的模糊信息表示法中,属性用模糊语言变量值表示,语言变量值可构造成标度格,采用此格分类形式背景中的对象。Burusco等从L模糊集合的形式背景构造格,采用fixpoint理论[41],给出了一个计算格结构的方法。Girard研究了由模糊量词描述的数据的概念格的构造问题,通过在数据类型定义中插入模糊量词集处理模糊信息。

 在以往的数据挖掘研究中,基于的信息多是标准的、而非模糊的。概念格作为一种优良的形式化分析工具,在人工智能、知识发现等诸多领域都有广泛的应 上海大学博士学位论文 用。但目前,大量的研究也多是基于标准形式背景即二值背景的。本体的研究同样多是基于标准背景做的。而在实际中,存在大量的模糊信息。因而,对其表示和处理的研究具有很好的应用价值。关于模糊概念格的模型及其应用研究即是本文的主要内容。

 1.3.论文的主要研究内容 论文的主要研究内容包括模糊信息的处理、模糊背景的约简、模糊概念格的构造、模糊规则提取、模糊概念格的分布式构造、生成模糊本体的方法。

 在论文的第一章绪论中,我们指出了本文研究的目的和意义并介绍了国内外的研究概况。

 在论文的第二章中,我们阐述了概念格和模糊集理论,包括概念格的基本定义、基于标准形式背景的概念格构造的描述,概念格构造的一般方法等。

 在论文的第三章中,我们研究了将模糊集理论引入概念格,描述了模糊概念格模型及模糊概念格的构造算法。定义了两个模糊参数E和6,分别表示概念节点中对象的平均隶属度和对象的隶属度值相对平均隶属度的偏离程度。

 在论文的第四章中,我们研究了基于模糊概念格的模糊关联规则的生成,在模糊概念格的节点级上,使用模糊参数6值的限定,可以避免生成非健壮节点对、从而避免提取效果欠佳的规则;实验分析了基于模糊概念格提取关联规则的算法的时空复杂度。

 在论文的第五章中,针对格的构造的巨大的时空复杂度问题,我们将分布处理的思想引入了模糊概念格,提出了分布式模糊概念格模型及模糊概念子格的并运算,提出并实验分析了模糊概念格的分布式构造算法。实验结果表明此算法比未采用分布处理的构造算法在时空复杂度上有很大改进。

 在论文的箔六章中,我们研究了模糊概念格在聚类上的应用,提出了采用模糊聚类技术和模糊参数从模糊概念格生成模糊聚类、构造模糊概念层次、进而采用映射构造模糊本体的方法,并给出了一个实例。

 在论文的第七章结束语部分中,我们总结了本文的工作,提出了下一步的研究:[作,例如概念格与粗糙集的结合等。

 第二章概念格和模糊集基本理论 2.1.概念格基本理论 形式概念分析理论是由德国的wille教授[1】首先提出的,其中概念格模型是形式概念分析理论的核心数据结构。在形式概念分析中,概念由外延和内涵组成,其中外延是属于概念的所有对象的集合,内涵是属于概念的所有对象所共同具有的属性集合。概念格是概念的层次结构,表现了概念问的泛化例化关系,对应的HASSE图可以实现格的可视化。

 2.1.1.基本定义 概念格是基于形式背景构造的,形式背景可以定义为一个三元组K=(u,A,I),其中U是对象集、A是属性集;I是u和A间的关系,满足式IuUx

 A,o∈U,d∈A。old读作对象O具有属性d。在U的幂集和A的幂集间可以定义两个映射f和g,称为U的幂集和A的幂集问的Galois连接。

 VO∈U:f【0)={d{Vo∈O,old} VD∈A:g(D)={OIVd∈D,oId} 如果二元组c=(O,D)满足两个条件:O=g(D)、D=f(o),则称C是形式背景K的一个形式概念。对给定的概念C,其内涵和外延分别表示为im(C)和ext(C)。K的所有形式概念记为cs(K)。cs(K)上的泛化例化关系定义为:如果O。£O:,N(o。,D。)是(o:,D:)的亚概念,记为(ol,D1)墨(02,D2)。通过此关系,可以得到一个序cs(K)=(cs(K),<),称之为形式背景K的概念格。

 2.1.2.概念定标与逻辑定标 对象.属性组成的二维表是描述实际问题的常用数据结构,在统计学中称为数据矩阵,在计算机中称为关系数据库,在形式概念分析中则称为多值背景。多值背景(O,D,A,I)是由集合O、D、A和它们之间的三元关系I组成的 其中。是对象集合、D是属性集合、A是属性值的集合、I是它们之问的三元关系。

 为了方便处理多值背景,可以先将多值背景转换为单值背景,这可以通过概念定标和逻辑定标实现。

 概念定标[2】是通过标尺从多值背景导出单值背景,通过给每个多值属性赋一个概念标尺sd实现的,其中sd是针对属性d划分的一个子背景(O,Dd,Id)。多值背景是由标尺族集fsdIdaD)组成的,称作简单定标的背景。即以单个多值属性为准,将多值背景划分为多个子背景。在子背景中,原单个属性值域转换为属性集合。通过使用概念标尺,可以产生存储于多值背景的数据的概念模式的全局视图。

 文[3]提出了逻辑定标的思想,是使用形式化的语言,根据多值背景的属性和属性值产生一元谓词,由谓词形成术语,从而构成导出的单值背景。

 与概念定标相比,逻辑定标的优点是:

 1.通过使用关系,例如析取等形式化语言元素,可以创建复杂的谓词2.指定术语比定义标尺更直观。

 2.1.3.概念知识处理 系统处理知识的过程包括知识表示、知识推理、知识获取、知识问的通信等。为了系统建模概念知识,需要对概念知识作出规范说明。概念知识处理[4]的基本组成成分是对象、属性和概念,可以通过四种关系联接基本组成成分,分别是对象具有属性、对象属于概念、属性从对象中抽象、及概念相互间的父子关系。在形概分析中,概念格的层次性和结构化特征可以很好地数学化,故形式背景和概念格可以作为概念知识形式化表示的理想数据结构。在概念知识系统中,知识获取部分可以通过属性勘探程序完成,即根据已有的信息,程序提问属性间的蕴含关系在某个概念域是否有效。通过询问领域专家可以完成交互过程,并更新概念知识系统。

 2.1.4.概念格结构在计算机各领域的应用 1.在软件工程方面 在【5]中,Arfi描述了一个生成smalltalk.80库的接口层次的工具。该工具根据从smalltalk代码直接提取的接口信息自动生成接口层,并提供了简单的图形 上晦大学博士学位论文 用户界面。

 在Igloo项目中,GodinR[6】开发了一个原型工具。该工具从类的规范说明中计算类层次,通过逐个插入新类生成概念格或其他形式的结构,结果的类层次可以交互地通过图形浏览器考察。

 在类库的开发过程中,类层次的设计通常存在某些缺陷。例如类C可能包含一个成员in,但成员m未被任一个C实例存取,则m应当被去除或移动到某个派生类。基于概念分析,snelting提出了一个补救此设计问题的框架[7】。通过分析一个类库以及使用它的应用程序来构造格,由此提供了有关类层次的有用信息,说明了如何根据格结构生成重构的类层次;以及格结构如何作为重组类层次的交互式工具的形式化基础。

 在软件再工程中,关于代码重组,过程和全局变量很重要。Lindig[8】通过分析过程和全局变量的关系构造概念格,说明了在格结构中如何得到模块结构,如何使用格结构评估模块候选项的内聚度和耦合度。

 关于配置的再工程,snelting在文[9】中根据现有源码推断配置结构,通过可视化显示生成格,可以清晰显示可能存在的配置的结构和性质,还可使配置结构的整体质量(据软件工程原理)得以形象显示。

 软件重用是使用已有产品创建软件系统,为提高软件效率,软件的重用很重要。文f101应用概念形成法采用两种方式支持重用,其中之一是建立一个导航空间(概念层次)组织和检索库中产品,提出更好的抽象以支持重用打包活动。文[11]针对可重用软件构件的检索,允许用户渐进式地采用一系列关键字检索用户所需的概念。

 2.概念格在数据挖掘中的应用 随着计算机技术的发展,信息激增,而真正有价值的是隐含于数据中的知识,因此数据挖掘得到了广泛应用。概念格的数学性质使其可以有机地组织数据,格节点体现了内涵与外延的统一,故很适于发现规则型的知识。

 Godin[121描述了概念格模型,提出了从概念格提取蕴含规则的算法,使用关系数据库函数依赖的理论结果处理规则的蕴含问题,但此蕴含规则是确定性规则,不具备抗噪音能力。

 上海大学博士学位论文 Missaoui[13]做了扩展,提出了从概念格提取近似规则(概率蕴含规则)的算法。Pasquier等[14】研究了关联规则的提取问题,以发现所有频繁项集为基础,提出了提取确定性关联规则的Auquerme—Guigue基、近似关联规则的适当基(properbasis)和结构基(structuralbasis)。

 在文【15]中,Wille提出了引入背景网络的形式方法,并在该文中采用多背景(multicontext)概念做为形式方法,还给出了不同背景间的四种操作,分别是并置(apposition)、T置(subposition)、融合(fusion)、级连(concatenation)。以Wille提出的多背景(multicontext)为依据,文[16][17】研究了在概念格框架结构下复杂对象中的概念学习和规则提取。

 3.概念格在其他领域的应用 概念格已成功地应用于信息检索、知识库组织等很多领域。

 在信息检索方面,概念格可以做为检索支撑。Godin[18]使用概念格结构做了信息检索,并和两种传统检索法:分别是在手工建立的层次分类系统中的导航和使用索引项的布尔查询做了比较,度量指标是搜索时间、查全率和查准率。结果表明层次分类系统检索的查全率明显低于其他两种方法。结论是基于格结构的检索能结合主题搜索的良好性能和浏览潜力,因此更具有应用前途。

 此方法是在概念层中,从格中一个节点航行到另一个节点,用户和系统间进行交互,节点表示当前的查询,通过连续选择子节点完成查询的逐步求精,连续选择父节点完成查询的逐步放大。

 在[191中,Carpineto对基于概念格的文本数据库的自动组织和混合导航做了全面研究,设计了一个检索系统ULYSSES,首先通过一个组织阶段建立数据的格结构表示,然后再对文本索引,对索引后的文本做格聚类。格结构表示为系统导航提供了支持。系统的导航阶段是~个可视化的检索界面,可以将三种检索策略结合起来,其中浏览和查询用于搜索检索空问,限界用于根据系统与用户交互过程中系统所获信息去限制检索空间的范围。此法的优点是灵活性高、检索性好。基于格的信息检索与传统布尔查询在数据集上的对比实验表明了格检索的性能优于布尔检索。

 概念格的其他应用还有:RichardsDebbie[20]]直月j概念格对RippleDownrule做了有机组织;Cole的CEM电子邮管系统[21]通过将Email存在格中使得检索6 上海大学博士学位论文 邮件具有更大的灵活性。关于概念格的研究还有一些文献,可参见[22】[23Ⅱ24Ⅱ25Ⅱ26] 2.2.模糊集理论 当前模糊集理论的研究已经比较完善了,它最早是由Zadeh[27]提出的。模糊集合由具有模糊隶属度的对象组成,而模糊隶属度函数有多种表现形式,例如三角函数、直线函数、曲线函数...

推荐访问:及其应用 解读 模型 模糊概念格模型及其应用研究解读 模糊概念格模型及其应用研究解读电子版