精思入神分享 http://blog.sciencenet.cn/u/chinaontolog 从事生物多样性信息学与软件工程研究。

博文

植物志的知识描述文本分析

已有 3591 次阅读 2010-3-22 10:32 |个人分类:知识工程|系统分类:科研笔记

Object t1 = new Object();
t1.Properties.Add("Name").SetValue("植物");
t1.Properties.Add("Height").SetValue(15);
t1.Add("Name","植物");

乔木,高达25米;树皮灰色,平滑;幼枝密生黄色绒毛及粗毛。叶宽卵形,倒卵形或椭圆形,长7—14厘米,宽5—8厘米,先端短渐尖或呈尾状,基部偏楔形或近圆形,表面绿色,粗糙或有粗毛,中脉凹陷,黄色,有粗毛,背面黄绿色或黄色,脉纹显著凸起,密被黄色绒毛。叶缘中部以上有波状圆齿,叶柄长1—1.5厘米,较粗壮,密被黄色绒毛。核果桔红色,光亮,卵状球形,直径10—13毫米;果梗粗硬,长1.5—2.5厘米,具绒毛。花期4—5月,果期8—9月。

植物志的植物属性表达方法分析:

1、 【属性值】
 直接给出属性值,省略属性名。例如:“乔木”
 识别:
 根据属性的取值范围和类型模式,查询当前对象那种属性可以取值为此类型或范围,从而识别出属性名。
 问题:
 属性值的数据类型及其构成模式分析?
 
2、 【属性名】【赋值谓词】【属性值】
 例如:“高达25米”
 识别:
 (1)难点是属性名可能不一致,有多种表达方式。可以根据关键词进行模糊匹配。应该尽量积累属性名的表达方式。例如:植物体高度,表达为“高”、“高度”等
 (2)赋值谓词:如“是”、“达”等。赋值谓词可以专门作为一个概念研究一下。
 问题:赋值谓词的类型与分类、模式?
 
3、 【对象】【属性值】
 例如:“树皮灰色”,实际上是 “树皮.颜色=灰色”
 识别:
 (1)根据对象,确定搜索空间
 (2)根据表达方式1,判断具体指代那一个属性
 
4、 【】,【属性值】
 例如:“...,平滑。”
 识别:
 (1)相当于表达方式3,省略了当前对象。需要根据上文环境进行判断,先找出当前对象。
 (2)根据表达式3来确认
 
5、 【时态对象】【赋值谓词】
 例如: “幼枝密生黄色绒毛及粗毛”。幼枝是枝条的不同时态下的表达。
   “幼枝密生黄色绒毛及粗毛” = 枝条(幼年).毛 { 疏密:密。颜色:黄色。类型:绒毛|粗毛}
   
 问题: 时态对象的识别与处理?时态的修饰,使得时间线上对象帧(借用电影的概念)被创建。

6、 【...】,【对象部位】【赋值谓词】
 例如: “...,基部偏楔形或近圆形”
 
 问题: 部位词的修饰使得对象被层次化,形成下位对象。

7、 【属性名】【多属性值赋值】 
 例如: “粗糙或有粗毛”,一个属性可能有几种属性。属性也有可能同时出现。
 

植物
{
 生活型:[乔木|灌木|草本]
 高度:Length,Unit[]
}


一些基本定义:

数字(整数、小数),文字,英文字符,中文字符,符号,混合字符串

方向:


计量:

长度 = 数字+长度计量单位
高度 = 数字+长度计量单位


首先要确定一些基本概念,建立类,才能利用它们再解释一般概念



https://blog.sciencenet.cn/blog-344159-305147.html

上一篇:通用的数据库检索系统
下一篇:近期的校园伤害案件的社会心理学原因
收藏 IP: .*| 热度|

1 高建国

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-27 21:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部