语义网的核心问题就是要表达网络信息的语义(semantics),也就是我们通常所说的意义(meaning)。从逻辑学和语言学的角度来讲,所谓的语义指的是一个描述或一个词汇(或不严格地说,一个概念)与它所要表达的在客观或主观世界上所对应的一个实体所建立的一种联系。比如说,“老虎”这一词的语义,指的是它所对应的在客观世界中存在的一类动物的总称;“孙悟空”这一概念的语义,指的是它所对应的在人们文化精神世界中所描述的某个具体的人物。只要能建立这种概念与它所要指称的实体之间的联系,我们通常就可以认为它就已经表达了该概念的意义,即语义,这就是语义的指称性。
准确地讲,语义具有下列几个主要特征:
指称性( denotation):即上面所述的,语义应能体现概念或术语它所对应的在外部世界上的某个实体的联系;
唯一性(uniqueness):如果不同的术语用来表达同一个意义的话,则应指向唯一的一个外部实体,而不是多个外部实体;
关联性(relatedness):语义应能表达一个概念与其他概念之间的关联关系,而不是简单地对应到一个外部实体。
当然,人们通常所理解的意义远比上述这些特征更丰富。著名的数理逻辑的创始人之一的Frege就区分了Reference 和Sense 。前者指的是我们上面所说的语义的指称性特征,如我们用“张老师”来指称世界上某个具体的人物;后者指的是描述所附带有涉及语用环境的含义,如“张老师”还可能在特定的环境下包含着“尊重”的含义。在语义网上,我们关注的是描述的指称性及其相关的特征,而在目前情况下不去关注“含义”所涉及的一系列特征。
语义网是通过把概念指向某个网络资源来实现语义指称性的,具体地说,它通过在有关描述上附加一个URI(唯一资源标识Uniform Resource Identifier )的前缀来实现的。如要表达“老虎”这个动物概念,则使用类似于下列描述来表达:
http://cohse.semanticweb.org/ontologies/animal#tiger
这里tiger是该概念的直接描述,而其前http://cohse.semanticweb.org/ontologies/animal#是该概念所对应的唯一网络资源标识符。显然这里所体现出来的指称性并不直接对应到我们通常所理解的在客观世界上的对应物(实际上也是不可能直接做到的)。在逻辑学和数理语言学上,也是通过语言陈述与它所对应的语义模型建立对应联系来实现的,这里的语义模型只是一个形式化的数学描述,而形式语义定义的最重要的特征是实现它的唯一性和关联性。唯一资源标识URI给语义网提供了一个非常有效的实现语义唯一性的手段,因为URI总是给出网络资源的唯一标识。这可以用一个不太准确但形象化的描述来概括:“无二义就是有意义”,即只要能够由计算机或人类把一个概念对应到一个无二义性的指称实体上去,就可以认为把握了该概念的语义了。语义的关联性是通过本体描述来实现的。正如本章前面所介绍的,本体描述了概念之间的包含关系,个别与一般的关系,部分与整体的关系,这就充分表述了概念之间的关联性。
所以说,网络技术在一定程度上是能够用于体现描述的语义性的。它也为机器自动处理提供了最重要的基础。这里最重要的技术关键就是基于网络的本体语言的开发与使用。
摘自 马张华,黄智生(著)《网络信息资源组织》(第八章 本体技术与语义网),北京大学出版社,2007.
https://blog.sciencenet.cn/blog-211188-214892.html
上一篇:
24年以前的中国逻辑程序设计(Prolog)学术研讨会下一篇:
语义网与本体技术纵横谈之二:对中国语义网论坛第一专题讨论的点评