一、领域本体中的概念相似度计算(论文文献综述)
张秀丽[1](2021)在《基于多模态数据语义检索的关键技术研究》文中指出随着科技的发展,互联网渗透到生活中的方方面面,从海量的网络资源中寻找所需要的信息,成为人们日常生活的一部分。信息数据呈爆炸式增长,多媒体数据从过去单一文本发展成为如今的图像、视频、文本等多种不同的媒体表现形式,网络信息呈现多模态化。由于机器无法理解信息的语义,传统的基于关键字的信息检索方法无法精确提供符合用户真正需求的信息。语义检索成为迫切需求。针对计算机难以理解多模态数据所表达的复杂的语义信息,本文利用OWL-S服务描述框架对多模态数据进行标注,根据本体概念对文本数据进行语义描述,利用本体描述模型建立图像视频的元数据与高层语义的联系。视频的标注建立在关键帧图像标注的基础上,与图像不同的是视频的对象语义是视频中的运动目标,因此采用高斯混合模型对帧序列图像进行前后景分离来获取运动目标,然后通过标注的关键帧文档集合表示视频标注文档。为实现语义检索,本文提出改进朴素贝叶斯分类的语义Web服务匹配算法。针对传统朴素贝叶斯是基于特征独立的条件下实现的,本文通过对服务描述文本采用文本聚类算法得到不同的类别,利用不同类别内关键词的特征权重结合朴素贝叶斯算法,可以有效的降低特征独立这一影响因子对朴素贝叶斯分类算法的影响。同时改进了基于距离的本体概念相似度算法,不仅提高Web服务匹配检索的时效同时也提高了服务匹配的精确率。实验采取查全率和查准率作为评估指标。通过大量实验,本文提出的基于本体的多模态数据标注方法有效的支持了语义检索,本文提出的改进朴素贝叶斯分类的语义Web服务匹配算法,通过与基于关键字的信息检索的实验对比分析,本文方法在查全率提高了12%,查准率方面提高了33%,时效上提升了26%,能够更好的满足用户语义检索的需求。
严行[2](2019)在《基于本体的绿色建筑技术设计案例推理系统研究》文中研究说明建筑业作为全球变暖的重要的驱动因素之一,转变其发展模式势在必行。绿色建筑是一种新型建筑,具有节能、节水、节材等特点,能够有效减少建筑对环境影响,为人们提供健康、舒适的人居环境。近年来,我国绿色建筑发展迅猛,然而绿色建筑设计仍面临着诸如:设计效率低、技术选择不合理、经验难以共享等问题,为改革绿色建筑设计手段提出了迫切需求。另一方面,随着计算机和人工智能等技术的普及,建筑设计流程和设计方法也发生了深刻的转变。因此,如何利用人工智能技术整合已有的建筑设计资料,辅助建筑设计师进行设计决策,是提高绿色建筑设计效率和推动建筑业智能化发展的重要手段。本研究以提高绿色建筑技术设计效率和效果为目的,从现有建筑设计流程出发,应用案例推理和本体技术的原理,创新性地提出了基于本体的绿色建筑技术设计案例推理系统。本研究的主要内容包括以下五个方面:(1)建立了绿色建筑技术设计案例推理系统的框架本研究首先对专家决策系统、案例推理理论、本体方法论进行梳理,并对绿色建筑内涵、发展历程、评价体系进行剖析,分析了绿色建筑设计的特点、流程、团队组建和面临挑战,提出了绿色建筑技术设计的基本内容。在此基础上,对比分析了案例推理的流程与绿色建筑技术设计流程的相似性,探讨了案例推理技术与本体技术相结合的优势,提出了绿色建筑技术设计案例推理系统的基本框架。(2)建立了绿色建筑领域本体本研究提出了绿色建筑领域本体,以统一对绿色建筑领域知识特征的表述。为了提高构建本体的效率,本研究提出一种半自动的本体构建方法。在提取绿色建筑领域本体概念时,首先利用自然语言处理技术对绿色建筑标准文本进行预处理,再通过统计术语的词频和出现的文本数提取领域术语集合,然后利用WordNet同义词词典合并同义术语,最终提取绿色建筑领域概念集合。在提取概念间关系时,本研究采用后缀词和层次聚类法提取概念间的分类关系;采用关联规则方法提取概念间的非分类关系。(3)绿色建筑技术设计案例推理系统中的案例库构建原理本研究提出了提出了一种结合案例的基本特征和文本语义特征的绿色建筑技术设计案例表示模型。首先采用文献研究法从现有文献中提取六个案例的基本特征,然后基于绿色建筑领域本体建立案例文本的语义索引,将案例文本最终表示为语义向量,形成统一的案例表达模板,并存储到案例库中。(4)绿色建筑技术设计案例推理系统中的案例检索机制建立案例检索机制的核心是案例之间相似度的计算。针对不同数据类型的基本特征,本研究提出了三种特征相似度计算方法。针对案例文本的语义特征,本研究提出了基于本体的语义检索方法。在此基础上,本研究采用层次分析法确定各个案例特征的权重,建立了案例综合相似度计算模型,最终形成案例检索机制。(5)绿色建筑技术设计案例推理系统的实证研究在系统需求分析的基础上,本研究构建了绿色建筑技术设计案例推理系统的架构和流程。在此基础上,设计了绿色建筑技术设计案例信息输入界面和绿色建筑技术设计案例推理界面。最后对绿色建筑技术设计案例推理系统进行了实证研究。实证结果发现利用该系统检索到历史案例与目标案例确实能够相互借鉴,也验证了本研究所提出的基于本体的绿色建筑技术设计案例推理系统的有效性。本文探索性的将人工智能技术引入到建筑领域,提出的绿色建筑技术设计案例推理系统具有很强的现实意义和理论意义。本研究提出的半自动的本体构建方法对其他领域本体的建立有一定的借鉴意义;同时,本研究提出的案例知识表示模型和案例检索机制丰富了案例推理的理论,能够推广到其他领域的案例推理系统中。在现实中,该系统不仅能够提升绿色建筑技术设计的效率,还能提升设计方案的水平。
刘富超[3](2019)在《非结构化文本上领域本体的抽取》文中研究指明随着大数据和人工智能时代的到来,数据成为了各行业的首要关注点,而传统的领域本体构建技术多数基于结构化数据或半结构化数据进行抽取,忽略了非结构化数据中可能包含的重要信息;其次,从中文文本中抽取本体的关键是术语抽取,而传统的词向量构建算法TF-IDF和word2vec需要重复遍历语料库,耗时高、杂质多,且不考虑术语的全文复现度和共现度,导致查准率和查全率较低;再次,中文术语从非结构化走向结构化需要进行概念性验证和结构化表示;最后,本体作为一种共享概念模型的形式化表示,应当具有较强的主动学习能力。针对上述问题,本文采用CKIP概念结构树,省略了人工标注;采用Wikipedia Extractor从维基百科中抽取多领域的文本数据,用wiki百科的定义数据作为偏移修正;在提出建立中文语料库的构建原则后,采用CKIP系统构建术语的概念结构树、进行文本预处理中的词法句法分析,制定3个基于语言形态和概念结构的参数WPOS、WTV、WTC,提出一种无监督的自组织映射SOM的术语抽取算法;本文从内涵、外延、同义词识别几个方面对术语进行概念验证,进一步简化概念结构树,进行语义消歧和冗余去除;使用规则匹配和后缀匹配相结合的方式、基于相似度的细粒度算法完成概念上下位关系抽取;给出中文领域本体的五元组形式化定义:D={C,A,R,O,X},提出基于事件三元组(A-R-O)的本体抽取的理论实现算法;最后,提出一种基于概念共振强度yCRS的并行模糊推理机制,用于提高领域本体的自学习能力。本文提出一套用于从非结构化中文文本中抽取领域本体的策略,以“足球”和“自然灾害”作为领域背景,以概念的上下位关系抽取结果作为评估指标,实验结果表明,在相同训练集下,本文方法可将非结构化领域文本逐步实现结构化处理,以底层关系数据表存储,且较之传统常用的TF-IDF相似度算法和word2vec词向量算法,在上下位关系关系抽取方面有相对较高的查准率。
杨蓉[4](2019)在《面向航空安全事件的语义查询及推理方法研究》文中指出航空安全是民航业发展的重中之重,目前民航突发事件应急管理领域本体主要基于RDF数据存储和查询,由于相同对象的描述用词存在着多样性和词语歧义等问题,容易产生低匹配和无匹配的问题。本文提出了一种基于RDF重写的语义查询及推理方法,主要工作如下:研究基于语义相似度和RDFS规则的重写方法。首先采用基于词向量的语义相似度计算方法将用户查询RDF三元组映射为领域本体RDF三元组,然后依据RDFS规则进行推理重写,实现领域本体RDF三元组的关系扩展重写。用户查询RDF三元组通过重写的方法,将查询转换为基于领域本体的查询。研究基于重写的航空安全事件语义查询与推理。通过词向量的语义相似度重写,实现用户查询RDF三元组中主语s、谓词p、宾语o与领域本体中概念、关系的映射。在此基础上,通过RDFS规则的推理重写,实现领域本体概念、关系、以及关系约束的重写。最后采用局部图匹配的方法对每一个节点的各个分区文件进行图匹配,完成航空安全事件的分布式查询。实验结果表明,基于RDF重写的语义查询及推理方法在查全率和查准率方面取得了明显的效果,能够改善查询过程中低匹配和无匹配的问题,为解决航空安全事件的查询问题提供了方法支持。
李桐宇[5](2019)在《面向领域的网页内容提取及语义标签生成框架》文中提出当今时代,互联网拥有着世界上最大的信息体量,构建领域搜索引擎、领域知识库以及文本分析时,都需要从互联网中获取领域、主题相关的海量文本数据作为支持。当前,自动化海量互联网信息采集方法主要面临以下三个难题:第一,常规的搜索引擎或爬虫,仅通过关键词匹配的方式搜索领域相关的信息,而这种单个或多个关键词组合的方式不能充分表述领域信息,没有全面考虑领域概念,因此准确率较低。第二,网页中存在大量不相关的内容,如导航栏、广告链接等,造成数据质量较低,给网页内容提取带来了难题。第三,网页中的文本信息没有相应的语义标签,但是在后续的文本数据应用领域中,如语义检索、信息推荐等,都依赖语义标签。语义标签的缺失导致网页文本难以直接、有效地支持后续应用。针对上述问题,本文提出了面向领域的网页内容提取及语义标签生成框架,通过链接的主题相关度预测算法,有效识别和目标领域相关的网页;并基于网页的文本对象模型,提取出网页的主体内容;最后,通过网页内容文本的统计和语义特征,生成每个文本对应的语义标签。本文的主要研究工作如下:一、提出了面向领域的网页内容提取及语义标签生成框架本文针对互联网场景下海量领域信息采集过程中的难题进行分析与归纳,针对性地提出了面向领域的网页内容提取及语义标签生成框架。框架分为网页采集层、数据提取层和语义处理层,能够有效识别主题相关的网页、提取网页的内容并生成内容文本对应的语义标签。二、提出了基于领域本体的链接主题相关度预测算法本文针对海量信息采集过程中准确率低的问题,提出了基于领域本体的链接主题相关度预测算法。该算法借助描述主题的领域本体,考虑链接URL、链接文本和链接上下文,预测链接的主题相关度,能有效识别主题相关的网页链接,提高准确率。三、提出了基于文本对象模型的网页内容提取方法针对网页中存在的大量无关内容,本文基于网页的文本对象模型,对文本对象模型进行压缩,然后通过文本链接密度,识别出网页的主体内容。最后针对聚集出现的噪声链接,提出基于节点熵的噪声链接识别方法,有效检测噪声链接。四、提出了基于统计和语义特征的语义标签生成方法该方法首先通过基于WordNet和Doc2Vec的语义消岐方法,确定文本中歧义单词的语义;之后,综合考虑统计特征、语义特征以及领域性,计算出语义标签权重,继而生成相关的语义标签。最后,基于语义标签,对网页内容文本进行聚类,更好地支持数据应用。五、构建了面向领域的海量信息采集平台基于本文提出的方法框架,设计并实现了面向领域的海量信息采集平台的原型系统,通过展示平台的相关功能以及与不同平台进行对比分析,验证本文所述的方法框架的实用性。
曹天天[6](2017)在《基于高血压领域本体的文本语义相关度方法研究》文中提出随着近年来互联网技术的快速进步和发展,文本信息量呈现爆炸性增长的趋势,作为信息的重要载体,文本处理成为信息研究的一个重要研究课题。文本之间语义相关度计算的相关研究是文本研究的一个重要方向,受到国内外信息领域研究者越来越多的关注。作为一种语义资源描述和推理工具,本体在诸多语义研究领域都得到了广泛的应用和研究,比如,自然语言处理、知识管理、知识工程、信息集成等。在本体论的基础上,领域本体是对特定领域的本体研究,可以对小范围内知识体系结构中概念和概念之间的关联关系进行更加详尽的描述和深入的发现。语义相关度的计算研究是本体映射推理、语义分析、数据分析和挖掘、知识管理和内容推荐等领域的研究基础。基于本体计算概念之间的语义相关度是一种常用的相关度计算方法。文本数据是非结构化的数据,类型庞杂且结构多样化,计算机难以理解和处理原始的文本信息。文本之间语义相关度的计算研究主要集中在以概念为基本处理单元来计算文本相关度的方法上,精准高效的对网页进行信息抽取往往是文本语义相关度计算的第一步。本文将采用知识点作为文本特征词,进行文本知识点抽取,然后通过计算文本知识点集合之间的语义相关度衡量文本之间的语义相关度。本文的主要工作和创新点如下:(1)构建高血压领域本体。本文以《中国高血压防治指南2010》作为高血压知识参考依据,结合“七步法”,采用Protege软件进行高血压领域本体的构建,为接下来概念语义相关度的计算研究提供数据基础。(2)提出一个综合多个维度的概念语义相关度计算方法LCA。文章研究了国内外概念语义相关度的相关研究理论,分析了基于概念距离的语义相关度、基于信息内容的语义相关度中存在的问题,并综合基于特征属性的语义相关度计算等三种方法提出一种基于本体的混合的概念语义相关度计算方法,并结合高血压领域本体进行权值估算。然后通过对比实验验证该方法的准确性。(3)提出一个基于本体和知识点的文本语义相关度计算模型LCA-KP,将知识点和基于本体的概念之间相关度相结合,以计算文本之间的语义相关度。在基于高血压的领域本体上进行实验分析,证明该方法在衡量文本语义相关度上具有一定的有效性。本研究是对基于高血压的文本语义相关度计算方法研究中一次综合性的研究,试图满足用户在较为专业的领域的对文本自动处理的需求。文中提及的文本语义相关度计算模型也可以推广到其他领域的相关度计算中。
甄亚亚[7](2017)在《领域本体的语义检索模型研究》文中研究表明目前传统的信息检索只是单纯的从关键字的角度进行检索,缺乏对知识的语义描述,这样的检索方式,返回的结果往往不能让用户满意。传统的关键字检索不能很好的解决“一词多义”和“一义多词”的情况。为了克服传统信息检索的不足,语义检索成为了信息检索中研究的新方向,本体的出现为语义检索提供了基础。本文主要研究基于领域本体的语义检索模型,主要的工作有以下几个方面。首先,论文构建了领域本体。通过分析归纳了构建领域本体的原则和方法,总结出了用类似于软件生命周期的过程构建领域本体的方法。本文以交通领域为例,按照需求分析、设计构建、语言描述、有效性评估、模型维护五个阶段构建了该领域的本体,最后使用形式化的方法描述了交通领域本体的类和属性。其次,论文提出了一种改进的基于领域本体的概念语义相似度计算算法。本文针对概念语义相似度中的节点密度影响因子计算结果值可能大于1的情况进行了改进,并在语义重合度基础上增加了每个祖父节点的权值,综合考虑了语义距离、节点深度、节点密度和语义重合度,提出了一种改进的领域本体概念语义相似度计算算法,并通过实验对比与分析验证了改进后算法的准确度有了一定的提高。最后综合词语-概念相关度和概念语义相似度,用概念的形式表示词语,完成词到概念的映射。然后,论文设计了领域本体的语义检索模型。本文根据词语到概念映射的结果,用语义特征向量对词向量进行了语义的表达,计算了语义特征向量的语义相似度。通过对领域本体语义检索模型的各个模块的作用和关系的分析,构建出了领域本体的语义检索模型。最后,论文设计并实现了领域本体的语义检索原型系统。为了验证本文研究的领域本体语义检索模型的有效性,通过分析领域本体语义检索原型系统的设计思路和工作流程,实现了领域本体语义检索原型系统。根据系统运行效果的对比,说明了本文研究领域本体的语义检索模型具有一定的优势。
陈茂榕[8](2016)在《领域依赖的Web信息抽取系统设计与实现》文中研究说明从非结构化网页中提取结构化信息的Web信息抽取技术广泛应用于商务智能、舆情分析和评论挖掘等领域。通过领域知识的应用提高信息抽取的准确性和抽取结果的可读性是当前的研究热点。由于本体具有清晰的层次体系结构和较好的可拓展性,目前被广泛应用于信息抽取领域,但利用本体进行信息抽取还需要解决:1)控制领域本体构建复杂度的问题;2)集成知识工程方法而导致的可移植性问题;3)领域本体在信息抽取中的不充分利用问题。本文的基本思路是通过对本体进行语义拓展以构建模糊领域本体,从而控制领域本体构建的复杂度;为实现语义拓展,给出语义模糊集的定义及其拓展方法。为提升信息抽取的准确性,提出领域依赖的Web信息抽取方法,将以模糊领域本体表示的领域知识应用于机器学习方法,在提高抽取质量的同时有效提升抽取方法的可移植性。此外,为更好地利用本体的语义关系信息,设计基于本体的抽取结果优化算法。本文的主要工作如下:(1)给出语义模糊集与模糊领域本体的构建方法。为控制本体构建的复杂度,对本体中的概念和属性等信息进行语义拓展,以构建模糊领域本体。为实现语义拓展,给出语义模糊集的定义,并提出基于Word2Vec的语义模糊集拓展方法。(2)提出领域依赖的Web信息抽取方法。为提升信息抽取的准确性,以模糊领域本体为知识表示方式,提出领域依赖的Web信息抽取方法,将领域知识应用于机器学习方法的特征工程中,在提高抽取质量的同时有效提升抽取方法的可移植性。(3)设计基于本体的抽取结果优化算法。为更充分地发挥本体在信息抽取中的作用,根据多层分类与结构化学习的思想,利用本体中概念间的语义关系信息,设计基于本体的抽取结果优化算法,对抽取结果进行优化。(4)构建领域依赖的Web信息抽取原型系统,并对其进行有效性评估。根据领域依赖的Web信息抽取方法,进行原型系统的设计与实现。通过在实际数据集上的实验,分析了领域依赖的Web信息抽取方法的实用性,评估了基于本体的抽取结果优化算法的有效性。
朱惠[9](2015)在《中文学科术语本体学习方法研究 ——以数字图书馆领域为例》文中认为相较于万维网(World Wide Web,WWW),语义网(Semantic Web,SWeb)是一种智能网络,它能对其中的信息资源进行语义描述,不仅能理解词汇和概念,还能理解它们之间的逻辑关系。语义网使得计算机能更好地理解信息资源的含义,也使得人与计算机之间的交流更有效率和价值。而本体机制则是实现语义网的核心技术,作为一种知识描述和组织方式,它具有概念化、形式化、明确性和共享性四大特征。本体层是语义网7层体系结构中的第4层,它将信息资源按照语义方式描述和组织,是进行信息资源交换与共享的基础。对信息资源进行语义描述和组织依赖于相应领域本体的构建。早期的领域本体构建是依靠本体工程师和领域专家手工完成的,但这样的构建方式存在以下缺点:(1)耗费大量的时间和人力;(2)受领域专家主观因素的影响。针对这些问题,学术界提出了本体学习(Ontology Learning),即利用数据挖掘、机器学习、数学统计等方法和技术,通过计算机自动或半自动地从已有数据资源中发现本体元素,包括概念、实例、分类关系、非分类关系和公理。基于非结构化文本进行领域本体学习是当前计算机科学和信息科学领域的研究热点和前沿,而中文非结构化文本由于其自身的特点对本体学习方法和技术又有着不同的要求。通过文献调研发现目前基于中文文本进行本体学习的研究状况是:(1)聚焦在理论设想和方法论证上;(2)对本体学习框架和流程的讨论较多,但目前还没有一个具体的可应用的本体学习系统;(3)中文自然语言处理技术的不成熟对本体学习也有着较大的影响;(4)对本体概念非分类关系获取的研究较少。在上述情况下,本论文基于数字图书馆学科领域的中文非结构化文本,探讨本体学习的方法和技术。首先对本体基本概念和理论进行了阐述;然后构建了领域本体学习系统模型,并利用数据挖掘和数学统计等方法和技术构建了领域本体,该本体包含的元素包括:领域概念、概念的分类关系和非分类关系,最后对构建的领域本体进行描述、存储和可视化展示。本论文的主要工作包括:(1)构建了面向中文文本的基于技术集成的领域本体学习系统模型。在文献调研、系统剖析、应用借鉴的基础上,深入探讨本体学习的功能组成和学习流程。以提供知识服务为总体目标,集成多种数据挖掘技术和数学统计方法,构建了一个面向知识服务的领域本体学习系统模型,提出并论证了模型中关键组件的具体实现方案。(2)实现了基于中文文本的领域术语以及作为术语非分类关系标签的谓语动词的自动识别。具体实现过程中,采用了中文分词、数学统计、权重计算等方法对非结构化领域文献中包含的领域术语以及谓语动词进行抽取。(3)建立了具有实用价值的面向“数字图书馆”领域的术语分类关系的自动抽取模型,实现了领域本体中术语分类关系(层次关系)的抽取。首先基于非结构化领域文档构建术语的向量空间模型,在此基础上,利用BIRCH预聚类和层次聚类挖掘领域术语间的分类层次关系,并利用术语综合相似度指标确定类标签。(4)建立了具有实用价值的面向“数字图书馆”领域的术语非分类关系的自动抽取模型,实现了领域本体术语非分类关系的抽取。首先基于非结构化领域文档构建句子-术语向量空间模型,运用关联规则挖掘方法获取具有非分类关系的术语对,然后基于句子-<术语,动词>向量空间模型再次利用关联规则挖掘术语的非分类关系,并为非分类关系分配了标签。(5)运用网络本体描述语言OWL对构建的“数字图书馆”领域本体进行了描述和存储。OWL把本体中的概念(术语)描述为类(Class),本体中概念(术语)间的关系将通过OWL中的属性进行描述。基于关系数据库对学科领域本体进行存储,关系数据库适用于大型本体数据的存储。(6)运用本体编辑工具Protege5.0beta中的可视化组件OntoGraf对本体进行可视化展示。可视化展示领域本体能使得用户对本体中的概念(术语)和概念(术语)间的关系有更直观形象的了解,并且可以从中发现新的领域知识。本论文的研究意义在于提供了如何从中文非结构化文本中获取领域本体元素的方法和技术,以及如何对领域本体进行描述、存储和可视化的方法和技术。
樊红杰[10](2015)在《基于领域本体的语义查询扩展方法及其应用研究》文中研究表明民航突发事件领域本体是以民航突发事件应急救援计划、民航应急管理相关规定、民航突发事件应急救援预案、民航突发事件历史案例为基础,通过概念以及概念间关系的形式化描述,明确了领域中概念及概念间的语义关系。之前开展的基于领域本体的语义检索方法主要考虑了概念间分类关系的语义距离这一因素,虽然有效解决了传统的基于关键词查询方法所存在的语义偏差和语义歧义等问题,但在查全率和查准率方面依然存在不足,本文针对该问题提出了一种语义查询扩展方法,该方法综合考虑了概念间的分类关系和非分类关系的语义查询,在以下方面开展了深入的研究内容:1)针对已经构建的领域本体,在分析概念间分类关系构成的基础上,通过引入关系权重、深度差等因素对最常用的基于语义距离、深度、语义重合度的语义相似度计算方法进行了改进,给出了基于分类关系的语义相似度计算方法,并结合突发事件案例的相似度计算,验证了该方法的有效性。2)针对领域本体非分类关系的构成,提出了一种基于非分类关系的语义相关度计算方法。该方法实现了数据属性类型和数据属性值在语义上的有效结合,同时解决了查询词与本体概念、实例存在多种对象属性的语义相关度问题,实现了语义查询的扩展。3)将基于分类关系的语义相似度和基于非分类关系的语义相关度计算方法相结合,根据查询词与本体概念、实例存在对象属性的情况采用不同的相关度计算途径,提出了面向民航突发事件领域本体的语义查询扩展方法,并将其应用于相似案例的语义查询中,通过实验给出了相似案例的事故原因、事故影响、救援预案、应急救援处置方法等信息,在查全率和查准率方面均获得了较好的效果,为突发事件的应急决策提供了更加有效的辅助信息。
二、领域本体中的概念相似度计算(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、领域本体中的概念相似度计算(论文提纲范文)
(1)基于多模态数据语义检索的关键技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 本文的研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 语义检索的研究现状 |
1.2.2 多模态数据标注的研究现状 |
1.2.3 本体的研究现状 |
1.3 本文主要研究内容 |
第2章 语义Web基础与本体相关知识 |
2.1 语义Web服务 |
2.2 OWL-S服务描述框架 |
2.3 语义检索 |
2.4 本体的介绍 |
2.4.1 本体概述 |
2.4.2 本体构建 |
2.4.3 本体描述语言 |
2.5 本章小结 |
第3章 基于本体的多模态数据标注 |
3.1 基于领域本体的文本数据处理 |
3.1.1 文本数据标注概述 |
3.1.2 具体算法 |
3.1.3 中文分词 |
3.1.4 文本数据标注信息 |
3.2 基于本体的图像数据处理 |
3.2.1 图像标注概述 |
3.2.2 具体算法及本体表示 |
3.2.3 图像对象和场景标注 |
3.2.4 图像对象空间位置关系标注 |
3.2.5 图像数据标注信息 |
3.3 基于本体的视频数据处理 |
3.3.1 视频标注概述 |
3.3.2 具体算法及本体表示 |
3.3.3 镜头分割和关键帧提取 |
3.3.4 视频运动目标提取 |
3.3.5 视频数据标注信息 |
3.4 基于本体的多模态数据标注 |
3.4.1 本体构建 |
3.4.2 OWL-S标注文档 |
3.4.3 多模态数据标注信息表 |
3.5 本章小结 |
第4章 改进朴素贝叶斯分类的语义Web服务匹配算法 |
4.1 基于Profile概要属性的改进朴素贝叶斯分类算法 |
4.1.1 朴素贝叶斯分类算法 |
4.1.2 改进的朴素贝叶斯分类算法 |
4.2 高精度IOPE功能信息匹配 |
4.3 本体概念语义相似度计算 |
4.3.1 基于路径距离的语义相似度 |
4.3.2 基于信息量的语义相似度 |
4.3.3 基于概念属性的语义相似度 |
4.4 本章小结 |
第5章 多模态数据语义检索关键技术验证与分析 |
5.1 本体概念语义相似度计算的验证与分析 |
5.2 多模态数据标注方法的验证与分析 |
5.2.1 文本数据标注方法的验证与分析 |
5.2.2 图像视频数据标注方法的综合验证与分析 |
5.3 语义Web服务匹配算法的验证与分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(2)基于本体的绿色建筑技术设计案例推理系统研究(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 研究背景 |
1.1.1 绿色建筑发展背景 |
1.1.2 绿色建筑技术设计面临的困境与挑战 |
1.1.3 建筑领域数字化的研究背景 |
1.2 国内外研究现状 |
1.2.1 绿色建筑设计研究现状 |
1.2.2 案例推理在建筑领域的研究现状 |
1.2.3 本体在建筑领域应用的研究现状 |
1.2.4 基于本体的案例推理系统的研究现状 |
1.2.5 研究综述小结 |
1.3 研究目的和意义 |
1.3.1 研究目的 |
1.3.2 研究意义 |
1.4 研究内容及结构安排 |
1.5 研究方法和技术路线 |
1.5.1 研究方法 |
1.5.2 技术路线图 |
1.6 创新点 |
2 研究理论基础 |
2.1 专家系统 |
2.1.1 专家系统的发展历程 |
2.1.3 专家系统的类型 |
2.1.4 传统专家决策系统特点 |
2.2 案例推理理论的基本原理 |
2.2.1 案例推理的发展历程 |
2.2.2 案例推理的基本原理 |
2.2.3 案例推理的特点 |
2.3 本体方法论 |
2.3.1 本体的定义 |
2.3.2 本体的分类 |
2.3.3 本体的构成要素 |
2.3.4 本体描述语言 |
2.3.5 本体的构建 |
2.3.6 本体学习 |
2.4 本章小结 |
3 绿色建筑技术设计案例推理系统框架构建 |
3.1 绿色建筑内涵及评价体系 |
3.1.1 绿色建筑内涵 |
3.1.2 绿色建筑发展 |
3.1.3 绿色建筑评价体系 |
3.1.4 绿色建筑评价体系对绿色建筑设计的引导作用 |
3.2 绿色建筑设计 |
3.2.1 绿色建筑设计的特点 |
3.2.2 传统建筑设计流程 |
3.2.3 绿色建筑设计流程 |
3.2.4 绿色建筑设计团队组成 |
3.2.5 绿色建筑设计面临的主要挑战 |
3.3 绿色建筑技术设计基本内容 |
3.3.1 节地和室外环境设计 |
3.3.2 节材设计 |
3.3.3 节能设计 |
3.3.4 节水设计 |
3.3.5 室内环境设计 |
3.4 基于本体的绿色建筑技术设计案例推理系统框架 |
3.4.1 案例推理技术应用于绿色建筑技术设计的可行性 |
3.4.2 基于案例推理的绿色建筑技术设计成果构成 |
3.4.3 基于本体的案例推理系统的优势 |
3.4.4 系统整体框架 |
3.5 本章小结 |
4 绿色建筑领域本体的构建原理 |
4.1 构建绿色建筑领域本体的任务 |
4.2 绿色建筑领域本体概念的提取原理 |
4.2.1 领域文本预处理 |
4.2.2 绿色建筑领域术语的提取 |
4.2.3 同义词合并 |
4.3 绿色建筑领域本体概念关系的识别 |
4.3.1 概念间分类关系的提取 |
4.3.2 非分类关系提取 |
4.4 绿色建筑本体构建的实现过程 |
4.4.1 绿色建筑本体概念及概念间关系提取 |
4.4.2 绿色建筑本体的实现 |
4.4.3 绿色建筑本体的形式化表示 |
4.5 本章小结 |
5 绿色建筑技术设计案例推理系统中的案例库构建原理 |
5.1 绿色建筑技术设计案例表示的框架 |
5.1.1 案例表示的原则 |
5.1.2 案例表示的方法 |
5.1.3 绿色建筑技术设计案例的内容 |
5.1.4 基于本体的绿色建筑技术设计案例表示的框架 |
5.2 绿色建筑技术设计案例的基本特征选取 |
5.3 绿色建筑技术设计案例的文本语义特征提取 |
5.3.1 传统文本表示的方法 |
5.3.2 基于领域本体的绿色建筑技术设计案例文本表示方法 |
5.3.3 绿色建筑技术设计案例文本的预处理 |
5.3.4 绿色建筑技术设计案例语义标引的建立 |
5.3.5 绿色建筑技术设计案例文本语义特征权重的计算方法 |
5.3.6 基于领域本体的语义向量构建的算法 |
5.4 绿色建筑技术设计案例的存储 |
5.5 本章小结 |
6 绿色建筑技术设计案例推理系统中案例检索机制的设计 |
6.1 绿色建筑技术设计案例检索方法和流程 |
6.1.1 案例检索方法 |
6.1.2 案例检索流程 |
6.2 绿色建筑技术设计案例基本特征相似度计算 |
6.2.1 绿色建筑技术设计案例基本特征的数据类型 |
6.2.2 绿色建筑技术设计案例的基本特征相似度计算模型 |
6.3 绿色建筑技术设计语义特征检索机制建立 |
6.3.1 基于本体的语义检索 |
6.3.2 基于本体的查询扩展 |
6.3.3 基于本体的语义检索模型中相似度计算 |
6.4 绿色建筑技术设计案例检索机制中综合相似度测算模型 |
6.4.1 案例全局相似度计算模型 |
6.4.2 案例特征权重确定方法 |
6.4.3 层次分析法 |
6.4.4 绿色建筑技术设计案例特征权重确定 |
6.5 绿色建筑技术设计案例调整及案例库的维护 |
6.5.1 绿色建筑技术设计案例重用与修正 |
6.5.2 绿色建筑技术设计案例学习 |
6.6 本章小结 |
7 绿色建筑技术设计案例推理系统的实证研究 |
7.1 绿色建筑技术设计案例推理系统的需求分析 |
7.1.1 系统的需求概述 |
7.1.2 系统功能需求 |
7.2 绿色建筑技术设计案例推理系统总体设计 |
7.2.1 系统架构设计 |
7.2.2 系统的工作流程 |
7.3 绿色建筑技术设计案例推理系统的界面设计 |
7.4 绿色建筑技术设计案例推理系统的应用 |
7.4.1 绿色建筑技术设计实证背景 |
7.4.2 绿色建筑技术设计案例推理系统的检索过程 |
7.4.3 系统检索结果的讨论 |
7.4.4 绿色建筑技术设计决策 |
7.5 本章小结 |
8 结论与展望 |
8.1 研究总结 |
8.2 研究存在的不足以及未来工作的展望 |
参考文献 |
附录 |
A 作者在攻读博士学位期间所发表的文章目录 |
B 作者在攻读学位期间参与的科研项目 |
C 绿色建筑领域本体概念间非分类关系提取的源代码 |
D 绿色建筑技术设计案例基本信息 |
E 学位论文数据集 |
致谢 |
(3)非结构化文本上领域本体的抽取(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 本体构建问题 |
1.2.2 本体学习问题 |
1.3 本体中的概念-实例匹配 |
1.4 论文章节安排 |
2 中文领域本体抽取的相关理论 |
2.1 中文领域本体 |
2.1.1 中文领域本体的上下位关系关系抽取过程 |
2.1.2 上下位关系关系抽取过程中的问题 |
2.2 文本预处理 |
2.2.1 文本抓取 |
2.2.2 中文领域语料库的构建 |
2.2.3 中文分词系统 |
2.3 术语抽取--SOM术语聚类 |
2.3.1 概念树中两术语的词性标签相似度W_(POS) |
2.3.2 术语的序列串相似度W_(TV) |
2.3.3 术语的概念结构相似度W_(TC) |
2.3.4 自组织神经网络聚类算法(SOM聚类) |
2.4 本章小节 |
3 概念验证及上下位关系抽取 |
3.1 中文术语的概念抽取 |
3.1.1 内涵、外延验证 |
3.1.2 概念的同义词识别 |
3.2 中文上下位关系抽取 |
3.2.1 基于模板规则匹配 |
3.2.2 基于概念后缀词的匹配 |
3.3 基于细粒度的上下位关系抽取 |
3.4 基于事件序列的领域本体抽取 |
3.4.1 事件的序列抽取 |
3.4.2 (A-R-O)三元组提取 |
3.5 本章小结 |
4 并行模糊推理机制(PFR) |
4.1 概念和新实例之间的共振强度 |
4.1.1 属性的共振强度X_A |
4.1.2 操作的共振强度X_O |
4.1.3 主动关系的共振强度X_D |
4.1.4 被动关系的共振强度X_R |
4.2 计算概念共振强度y_(CRS)的并行模糊推理 |
4.2.1 前提层 |
4.2.2 规则层 |
4.2.3 结论层 |
4.3 本章小结 |
5 实验仿真 |
5.1 中文术语抽取实验 |
5.1.1 数据集 |
5.1.2 评价标准 |
5.2 中文领域概念抽取实验 |
5.2.1 数据集 |
5.2.2 评价标准 |
5.3 上下位关系抽取实验 |
5.3.1 数据集 |
5.3.2 评价标准 |
6 总结与展望 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
(4)面向航空安全事件的语义查询及推理方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状分析 |
1.3 主要研究内容与论文组织结构 |
第二章 相关技术与理论研究 |
2.1 语义查询及推理方法研究 |
2.1.1 RDF数据的查询方法 |
2.1.2 RDF数据的推理方法 |
2.1.3 重写技术 |
2.2 民航突发事件应急管理领域本体分析 |
2.2.1 本体的相关技术 |
2.2.2 民航突发事件应急管理领域本体 |
2.3 分布式计算相关技术 |
2.3.1 Hadoop分布式系统 |
2.3.2 MapReduce并行计算框架 |
2.4 本章小结 |
第三章 基于RDF重写的语义查询及推理方法研究 |
3.1 重写技术框架 |
3.2 语义相似度重写 |
3.2.1 词向量简述 |
3.2.2 基于词向量的语义相似度重写 |
3.3 RDFS规则推理重写 |
3.3.1 RDFS规则 |
3.3.2 基于RDFS规则的推理重写 |
3.4 本章小结 |
第四章 基于重写的领域本体语义查询及推理 |
4.1 研究思路 |
4.2 领域本体语义相似度重写 |
4.2.1 语义相似度计算 |
4.2.2 语义相似度重写 |
4.3 领域本体RDFS规则推理重写 |
4.3.1 模式数据预处理 |
4.3.2 RDFS规则的推理重写 |
4.3.3 RDF三元组去重 |
4.4 领域本体RDF图数据分布式查询 |
4.5 实现效果与分析 |
4.5.1 实验环境与数据 |
4.5.2 实现效果与分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 本文工作总结 |
5.2 未来工作展望 |
参考文献 |
致谢 |
作者简介 |
(5)面向领域的网页内容提取及语义标签生成框架(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 链接主题相关度预测算法 |
1.2.2 网页内容提取方法 |
1.2.3 语义标签生成 |
1.2.4 国内外研究现状总结 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 面向领域的网页内容提取及语义标签生成的总体框架 |
2.1 业务场景 |
2.2 方法框架 |
2.3 本章总结 |
第三章 基于领域本体的链接主题相关度预测方法 |
3.1 链接的主题相关度预测方法流程 |
3.2 WordNet和领域本体 |
3.3 链接建模 |
3.4 链接分词 |
3.5 主题相关度计算 |
3.5.1 基于领域本体的主题相关度计算 |
3.5.2 基于语义拓展的主题相关度计算 |
3.6 实验与验证 |
3.6.1 实验数据准备 |
3.6.2 实验方案与评价标准 |
3.6.3 实验结果与方法对比 |
3.7 本章小结 |
第四章 基于文本对象模型的网页内容提取方法 |
4.1 网页DOM压缩 |
4.2 基于文本链接密度的内容提取 |
4.3 基于节点熵的噪声链接识别 |
4.4 实验与分析 |
4.4.1 实验数据集准备 |
4.4.2 实验评价指标 |
4.4.3 实验结果比较与分析 |
4.5 本章小结 |
第五章 基于统计和语义特征的语义标签生成 |
5.1 基于词典的最大匹配语义消岐算法 |
5.2 改进的基于WordNet和 Doc2Vec的语义消岐方法 |
5.2.1 文本向量Doc2Vec |
5.2.2 歧义单词上下文选取策略 |
5.2.3 歧义单词的语义消岐 |
5.3 语义标签生成方法 |
5.4 基于语义标签的文本聚类 |
5.5 实验和方法对比 |
5.5.1 语义消岐实验与分析 |
5.5.2 语义标签生成方法对比 |
5.6 本章小结 |
第六章 原型系统的设计与实现 |
6.1 系统应用背景 |
6.2 原型系统架构 |
6.3 原型系统详细设计与实现 |
6.3.1 数据层 |
6.3.2 逻辑层 |
6.3.3 应用层 |
6.4 原型系统验证及展示 |
6.5 系统对比与讨论 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 主要工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(6)基于高血压领域本体的文本语义相关度方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和意义 |
1.2 研究现状 |
1.2.1 本体和领域本体 |
1.2.2 概念语义相关度 |
1.2.3 文本语义相关度 |
1.3 研究的创新点 |
1.4 论文组织结构 |
2 相关理论基础 |
2.1 本体论 |
2.1.1 本体的定义和构成 |
2.1.2 本体的分类 |
2.1.3 本体描述语言 |
2.1.4 本体的构建 |
2.2 概念语义相关度 |
2.2.1 概念语义相关度和语义相似度 |
2.2.2 概念语义相关度计算方法 |
2.2.3 语义相关度评价指标 |
2.4 知识点相关理论 |
2.4.1 知识点相关理论 |
2.4.2 知识点的自动抽取流程 |
2.5 本章小结 |
3 高血压领域本体的构建和文本语义相关度计算模型 |
3.1 高血压本体的构造和存储 |
3.1.1 本体构建工具 |
3.1.2 高血压本体的构建 |
3.1.3 高血压领域本体的存储 |
3.2 文本语义相关度计算模型LCA-KP |
3.3 本章小结 |
4 概念语义相关度计算模型LCA |
4.1 概念语义相关度计算方法 |
4.1.1 基于概念距离的语义相关度计算 |
4.1.2 基于信息内容的语义相关度计算 |
4.1.3 基于特征属性的语义相关度计算 |
4.2 LCA概念混合语义相关度计算方法 |
4.3 本章小结 |
5 实验分析 |
5.1 实验1: LCA概念相关度计算模型参数估计 |
5.1.1 实验设置 |
5.1.2 实验步骤 |
5.1.3 实验结果分析 |
5.2 实验2: LCA-KP文本相关度计算模型有效性评估 |
5.2.1 实验数据 |
5.2.2 实验步骤 |
5.2.3 实验结果分析 |
5.3 本章小结 |
6 总结与展望 |
6.1 本文总结 |
6.2 工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表的论文 |
(7)领域本体的语义检索模型研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景和研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 领域本体构建 |
1.2.2 词到概念的映射 |
1.2.3 领域本体概念语义相似度计算 |
1.2.4 语义检索 |
1.3 论文的主要工作和组织结构 |
1.3.1 论文的主要工作 |
1.3.2 论文的组织结构 |
第2章 领域本体的构建 |
2.1 领域本体的构建 |
2.1.1 领域本体构建的原则 |
2.1.2 领域本体构建的方法 |
2.1.3 交通领域本体构建的过程 |
2.2 领域本体的形式化表示 |
2.2.1 类的形式化表示 |
2.2.2 属性的形式化表示 |
2.3 本章小结 |
第3章 基于领域本体的词语-概念映射 |
3.1 词到概念映射权重计算方法 |
3.1.1 词语-概念相关度计算 |
3.1.2 基于领域本体的词语-概念映射表示 |
3.2 基于领域本体的概念语义相似度计算 |
3.2.1 概念语义相似度影响因子计算分析 |
3.2.2 概念语义相似度计算模型 |
3.2.3 实验分析 |
3.3 本章小结 |
第4章 领域本体的语义检索模型设计 |
4.1 词向量的语义表示和语义特征向量 |
4.2 语义特征向量的语义相似度衡量模型 |
4.2.1 语义特征向量归一化 |
4.2.2 语义特征向量相似度度量 |
4.3 领域本体的语义检索模型 |
4.3.1 领域本体的语义检索模型分析 |
4.3.2 领域本体的语义检索模型设计 |
4.4 本章小结 |
第5章 领域本体语义检索原型的设计与验证 |
5.1 领域本体语义检索原型的设计 |
5.1.1 设计目标 |
5.1.2 设计思路 |
5.1.3 工作流程 |
5.2 领域本体语义检索原型的实现 |
5.2.1 体系结构和实现环境 |
5.2.2 原型系统的实现 |
5.3 领域本体语义检索原型的运行效果分析 |
5.3.1 性能评价标准 |
5.3.2 性能分析比较 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
研究生期间发表论文 |
(8)领域依赖的Web信息抽取系统设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 相关技术 |
2.1 知识表示 |
2.1.1 逻辑表示法 |
2.1.2 产生式表示法 |
2.1.3 框架表示法 |
2.1.4 语义网络表示法 |
2.1.5 本体表示法 |
2.2 文本分类 |
2.2.1 文本表示 |
2.2.2 特征选择 |
2.2.3 机器学习分类算法 |
2.2.4 数据集偏斜 |
2.2.5 多层分类 |
2.3 语义相似度计算 |
2.3.1 基于Word2Vec的语义相似度计算 |
2.3.2 基于HowNet的语义相似度计算 |
第三章 基于Word2Vec的模糊领域本体构建 |
3.1 领域知识表示与模糊领域本体 |
3.2 初始领域本体构建 |
3.2.1 初始领域本体构建方法 |
3.2.2 基于语料库的概念词抽取 |
3.2.3 基于卡方检验的特征词提取 |
3.3 模糊领域本体构建 |
3.3.1 语义模糊集拓展与语义相似度计算 |
3.3.2 基于Word2Vec的语义模糊集拓展 |
3.4 本章小结 |
第四章 领域依赖的Web信息抽取 |
4.1 领域依赖的Web信息抽取方法概述 |
4.2 领域依赖的Web信息抽取系统设计 |
4.2.1 系统体系结构设计 |
4.2.2 系统功能模块设计 |
4.3 领域依赖的初步信息抽取方法 |
4.3.1 候选抽取对象识别方法 |
4.3.2 特征表示及构建方法 |
4.3.3 抽取效果评估 |
4.4 基于本体的抽取结果优化算法 |
4.4.1 算法原理 |
4.4.2 算法描述 |
4.4.3 算法评估 |
4.5 本章小结 |
第五章 原型系统与实验 |
5.1 领域依赖的产品评论信息抽取系统 |
5.1.1 系统概述 |
5.1.2 开发环境 |
5.1.3 系统实现 |
5.2 实验设计与分析 |
5.2.1 实验环境 |
5.2.2 实验数据集 |
5.2.3 实验设计 |
5.2.4 实验分析 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
作者简介 |
(9)中文学科术语本体学习方法研究 ——以数字图书馆领域为例(论文提纲范文)
中文摘要 |
英文摘要 |
第1章 绪论 |
1.1 研究背景 |
1.1.1 语义网 |
1.1.2 本体构建 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.2.3 国内外研究现状评价 |
1.3 研究内容 |
1.4 研究思路与方法 |
1.4.1 研究思路 |
1.4.2 研究方法 |
1.5 研究意义 |
1.6 创新之处 |
1.7 论文的组织结构 |
第2章 本体学习基本理论 |
2.1 本体 |
2.1.1 本体的定义 |
2.1.2 本体的分类 |
2.1.3 本体的主要描述语言 |
2.1.4 本体的作用 |
2.2 本体学习工具和方法 |
2.2.1 Hasti |
2.2.2 OntoLearn |
2.2.3 Text-To-Onto |
2.2.4 OntoBuilder |
2.2.5 OntoLiFT |
2.2.6 GOLF |
2.2.7 OntoSphere |
2.2.8 各本体学习工具比较分析 |
2.3 本体与叙词表的联系与区别 |
2.3.1 术语与概念 |
2.3.2 叙词表的概念和应用 |
2.3.3 本体与叙词表的比较分析 |
2.4 本章小结 |
第3章 学科领域术语分类关系构建 |
3.1 数据基础 |
3.2 术语抽取 |
3.2.1 初步抽取 |
3.2.2 二次抽取 |
3.3 术语文档向量空间模型构建 |
3.3.1 非结构化文本NLPIR分词 |
3.3.2 文档术语频数矩阵 |
3.3.3 基于TF-IDF的特征项权重计算 |
3.4 改进的术语文档向量空间模型构建 |
3.4.1 改进原因及方法 |
3.4.2 基于扫描的文档与术语的语义关联 |
3.4.3 基于扫描的文档术语频数矩阵构建 |
3.4.4 基于TF-IDF的术语权重计算 |
3.5 术语词汇向量空间模型构建 |
3.5.1 术语共现关系中介的转变 |
3.5.2 术语词汇关联频数矩阵 |
3.5.3 术语词汇关联权重矩阵 |
3.6 学科领域术语分类关系构建 |
3.6.1 方法描述 |
3.6.2 BIRCH算法预聚类 |
3.6.3 层次聚类 |
3.6.4 类标签的确定 |
3.6.5 实验结果及分析 |
3.6.6 与现有方法及技术对比 |
3.7 本章小结 |
第4章 学科领域术语非分类关系构建 |
4.1 方法描述 |
4.2 关联规则分析 |
4.2.1 关联规则及其有效性和实用性 |
4.2.2 Apriori算法 |
4.2.3 GRI算法 |
4.3 非分类关系的术语对挖掘 |
4.3.1 句子术语向量空间模型构建 |
4.3.2 非分类关系的术语对获取 |
4.4 抽取学科领域动词 |
4.4.1 NLPIR词性标注分词 |
4.4.2 利用VF-ICF抽取学科领域动词 |
4.5 领域术语非分类关系标签分配 |
4.6 与现有方法及技术对比 |
4.7 本章小结 |
第5章 学科领域本体的存储和可视化展示 |
5.1 学科领域本体描述 |
5.1.1 本体描述语言OWL |
5.1.2 学科领域本体的OWL描述 |
5.2 学科领域本体存储 |
5.2.1 本体存储方式 |
5.2.2 关系数据库存储模式 |
5.2.3 学科领域本体存储模式设计 |
5.2.4 学科领域本体存储 |
5.3 学科领域知识本体可视化 |
5.3.1 本体可视化工具 |
5.3.2 基于Protege的学科领域本体可视化 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 本论文的研究内容和结论 |
6.2 研究中存在的问题 |
6.3 后续研究 |
致谢 |
读博期间科研成果清单 |
参考文献 |
(10)基于领域本体的语义查询扩展方法及其应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目标 |
1.3 研究内容 |
第二章 相关理论研究综述 |
2.1 本体及语义查询扩展 |
2.1.1 本体技术 |
2.1.2 语义查询扩展 |
2.1.3 基于本体的语义查询扩展 |
2.2 基于本体的语义查询扩展国内外研究现状分析 |
2.3 本章小结 |
第三章 基于分类关系的语义相似度计算方法 |
3.1 本体分类关系及语义相似度 |
3.1.1 本体分类关系 |
3.1.2 语义相似度 |
3.2 基于分类关系的语义相似度计算 |
3.2.1 语义距离的相似度 |
3.2.2 深度的语义相似度 |
3.2.3 语义重合度的相似度 |
3.2.4 基于分类关系的语义相似度计算方法 |
3.3 方法的实现过程与效果 |
3.3.1 实现过程 |
3.3.2 实现效果与分析 |
3.4 本章小结 |
第四章 基于非分类关系的语义相关度计算方法 |
4.1 本体非分类关系及语义相关度 |
4.1.1 本体非分类关系 |
4.1.2 语义相关度 |
4.2 基于非分类关系的语义相关度计算 |
4.2.1 数据属性的语义相关度 |
4.2.2 对象属性的语义相关度 |
4.2.3 基于非分类关系的语义相关度计算方法 |
4.3 方法的实现过程与效果 |
4.3.1 实现过程 |
4.3.2 实现效果与分析 |
4.4 本章小结 |
第五章 面向民航突发事件领域本体的语义查询扩展应用 |
5.1 分类和非分类关系相结合的语义查询扩展方法 |
5.2 语义查询扩展方法的实现 |
5.3 语义查询扩展方法的应用与分析 |
5.4 本章小结 |
第六章 总结与展望 |
参考文献 |
致谢 |
作者简介 |
四、领域本体中的概念相似度计算(论文参考文献)
- [1]基于多模态数据语义检索的关键技术研究[D]. 张秀丽. 沈阳理工大学, 2021(01)
- [2]基于本体的绿色建筑技术设计案例推理系统研究[D]. 严行. 重庆大学, 2019(05)
- [3]非结构化文本上领域本体的抽取[D]. 刘富超. 大连海事大学, 2019(06)
- [4]面向航空安全事件的语义查询及推理方法研究[D]. 杨蓉. 中国民航大学, 2019(02)
- [5]面向领域的网页内容提取及语义标签生成框架[D]. 李桐宇. 上海交通大学, 2019(06)
- [6]基于高血压领域本体的文本语义相关度方法研究[D]. 曹天天. 武汉大学, 2017(06)
- [7]领域本体的语义检索模型研究[D]. 甄亚亚. 武汉理工大学, 2017(02)
- [8]领域依赖的Web信息抽取系统设计与实现[D]. 陈茂榕. 东南大学, 2016(03)
- [9]中文学科术语本体学习方法研究 ——以数字图书馆领域为例[D]. 朱惠. 南京大学, 2015(12)
- [10]基于领域本体的语义查询扩展方法及其应用研究[D]. 樊红杰. 中国民航大学, 2015(03)