魔幻空间:教而不研则浅,研而不教则空。分享 http://blog.sciencenet.cn/u/njumagic 个人网页:http://cs.nju.edu.cn/szx/

博文

普适计算中的数据管理

已有 5652 次阅读 2009-2-8 16:34 |个人分类:学术动向|系统分类:科普集锦| 普适计算, 普适计算, 数据管理, 普适计算, 数据管理

体积更小、处理能力更强的设备,改进的有线无线的网络,数据传输和表示的标准( HTMLXMLHTTPWAP等),这些因素的结合使得计算机在人的日常生活中扮演更重要的角色。有理由相信最终这些设备将普遍深入到我们生活中对我们的生活起到关键的作用,但是一切都是在不知不觉之中,好像在无形中发挥作用。这种被成为普适计算的概念在过去的十年中吸引了很多计算机研究者,这个概念首先是由Mark Wieser提出的。
 
当然,任何依赖于计算机或PDA人知道,普适计算实现之前还有很多工作要做。加快实现普适计算的必须的技术是提高速率。很多这个领域的研究者关注的是改进设备本身和他们使用的通信技术。对于设备,关键是在减小体积、成本、功耗的同时提高它的功能。对于通信技术,关键是提高带宽和覆盖率,发展协议使得能有更强的容错性和提供无线和移动连接。
 
改进的硬件和网络显然对于普适计算的发展十分重要,同样重要的和困难的是数据管理。为了支持计算行为背景化,数据必须是可靠地、高效地被存储、查询和传输。传统的数据管理如缓存、并发控制、查询处理需要适应普适计算环境的要求和限制。这些环境包括资源限制、间歇的变化的连接、移动的用户和动态的合作。
 
本文中,我们首先讨论普适计算支持的应用的主要特征和这些应用对数据管理的要求。然后我们介绍数据管理的不同方面以及它们是怎么适应这些新的要求的。
 
应用和数据管理的要求
虽然对普适计算的前景大家由共识,但是并没有明显的所谓的“杀手锏应用”。很多研究者和产品开发者开发样品在特定情形下阐述这种技术的潜能。由于这种综合的全局的普适计算的应用,特定的产品具有比单个应用多很多的功能。有的厂家提出这种技术强调的是用户的经历而不是一个或以一套特定的应用。这些情形中用户被若干移动设备“包围”,在不同的环境(家、办公室、汽车、会议室)中移动。这些设备主动地提醒用户制定的任务,对这些任务相关的部分或所有信息提供访问,并且使得在任务中的独立的小组之间通信变得简单。
 
功能的种类
与其举例另外的场景还不如分类各种场景功能有用。这些功能分类用来决定数据管理的要求。功能可以按照以下的方式分类:
1)对移动的支持-小型设备与无线通信的融合意味着这些设备可以被用于移动的情况下。所以,相关的应用要能够在变化的、动态的通信计算环境中运行,可以从一个网络提供商移动到另一个网络提供商下正常操作。此外,本地化的新的应用同样要被开发。
2)上下文感知-如果设备真正做到是普遍存在的,那么它们就必须做到在大范围的持续变化的条件下使用。对于那些真正对人有帮助的设备,它们必须对环境以及用户正在执行的和即将执行的认为能够感知。上下文感知的系统从智能提示系统(提醒用户一个重要的事件或者数据)到“smart空间”(房间或者环境能对当前出现的人和事进行适应)。
3)协作的支持-普适计算应用的另一个重要主题是对一组人的支持。这种支持包括通信、会议和共享数据的存储、维护、传输以及表示。如果所以的参与者可能的话,协作可以是实时发生的,当然可以是异步的。除了支持当前发生的协作,系统还要求能回溯和分析已经发生的行为。
 
适应性和用户交互
上述的这些功能对数据管理提出了许多挑战,其中对适应性的要求是所有的功能共同要求的。移动的用户和设备、不断改变的上下文、动态的群组这些对适应性提出很高的要求,而这恰恰是传统的数据管理技术不能表示的。适应性是本文余下部分讨论的技术的共同的主题。
 
普适计算是为了提高人在执行各种任务的能力的,所以这些应用中用户是实时地与计算机进行交互。有的情形下,我们把提供用户对不确定事件的动态干预作为提高适应性的一个方面。群组系统中对共享数据的访问和更新是这种设计思想的具体的例子。不像传统的数据库系统并发控制机制中利用严格的用户交互的类型和度的限制,群组系统数据管理者则很少采用严格的限制规则。放宽规则降低了系统自动处理的范围的冲突。系统自动处理它们能够处理的事件,当它们检测到不能处理的冲突的时候,只是简单地提醒用户发生冲突了并允许用户根据当时的情形来处理冲突。把用户包括在处理的过程中可以提供更强的适应性。
 
其它还要一些数据管理的要求虽然并不像适应性那样作为所有功能共同要求的,但是为了支持全面的普适计算的环境也应当被提出来。例如,移动性带来很多问题。首先,移动的终端以及有限的存储能力意味着普适计算系统能够从不同的变化的位置接受和发送数据。这就需要对不同的代理支持,因为用户要在不同的代理之间移动。协议就必须在这样的要求下构建以满足不见断的支持代理的变动。移动性还要求智能的数据筹备,这样数据能够在用户需要的时候放置在离用户很近的位置。
 
其次,移动性把在固定场景下不是很重要的位置因素引进到应用中来。例如,很多为移动设备服务的系统是以位置为中心的。假定有这样的系统,它能够回答这样的问题“找出以我的位置为中心2英里内的药店”。这样的系统一定可以跟踪当前用户的位置并能够访问到与相关位置、距离有关的信息。从更一般的范围说,系统能够大量的移动对象,并能预测它们未来的位置。例如交通控制系统要追踪大量的汽车,包括它们的当前位置、方向以及速度。以位置为中心的计算要求特定的数据结构,这种结构能够把位置信息有效地保存起来。
 
上下文感知的要求
上下文感知的功能对系统中保存的知识以及如何利用这些规则提出要求。为了支持上下文的感知,系统必须保存用户的要求、角色、偏爱等内部信息。这种系统的一个例子就是智能的日程安排系统,它能够根据用户的近期安排给用户发送信息。比如用户下午与特殊的客户下午见面,系统可以自动向用户发送与下午见面相关的信息(客户帐户、以前会谈的结果、与会议主题相关的文章)。
 
负责的系统可能利用各种传感器来监控环境并跟踪用户的行为以帮助用户完成正在进行的任务。这种基于传感器的系统要求能够实时处理数据流并能够分析和解释这种数据流。所以普适计算中数据流处理扮演着重要的角色。
 
无论系统是怎样接受上下文信息,从传感器、用户输入、个人信息管理运用或者联合各种方式,系统必须能够很好地对这些数据提供处理以能够准确地获致当前环境的状态或者用户的兴趣。上下文感知的应用还要求系统有推论和机器学习的能力。所有的这些必须能够处理不完整的、有冲突地数据,并能够足够有效地与用户进行交互。
 
协作的要求
我们讨论的最后一组要求是为了支持动态的一组人或者工作的协助。如前面所述,这种应用的主要的要求是适应性的要求。此外,除了适应性还有其它的一些尚未讨论的要求。首先是同步和一致性地要求。任何支持协作的应用的核心是一组共享的数据的建立、访问、修改和删除。这种功能必须是灵活的这样不同类型的交互(从聊天的工具到传统数据库的四个特性——原子性、一致性、隔离性、持久性)才能够很好的支持。
 
协作应用的另一个要求是对历史的可靠的可行的存储。如果协作是在同步方式下发生的,用户要能够访问在协作的早些时候发生的事件。还有,如果协作的参与者允许在中途有变化,对参与者和其行为的持久的记录可以加快新的参与者的融入。这种持久的记录可以有效的作为行为的日志,而用作对协作的各种结果的起因的追踪,或者用作机器学习或者数据挖掘来帮助优化以后的协作。
 
数据管理技术的例子——当前进行的项目
前面的讨论中描述了为了支持普适计算场景的数据管理中遇到的挑战并概述了普适计算应用的特性。这一段,我们主要描述两个正在进行的系统。第一个系统是Data Recharging,发掘用户的兴趣和偏好信息并把这些信息更新和相关的信息传递给用户的移动设备。第二个系统是Telegraph,建立适应数据流结构的数据处理来处理不同的数据流上(传感器数据流、动态环境数据流)的查询操作。
 
Data Recharging:Profile-Based Data Dissemination and Synchronization
移动设备需要两个资源:数据和能源。由于移动设备体积和成本的限制使得它不可能始终连接到固定的能源和数据(因特网等)上。移动设备利用缓存技术来解决这种不相连接的问题。设备利用充电电池来缓存能源,利用本地存储来缓存数据。一段时间后,设备本地的资源必须连接到固定的资源上“充电”。利用现在的技术设备中已驻数据的更新和补充比能源的补充更麻烦、和易出错。能源的补充可以在任何地方,只需要很少的用户干预,并能够累进的进行——充电时间越长,能源储备越充足。但是,数据的补充并不具备这些特性。
 
Data Recharging项目是开发这样一种服务和相关的基础设施,使得移动设备在任何地方、任何时间内接入到因特网以后设备就拥有比接入以前更多更有用的信息。数据更新的开始要求设备拥有一个插入式的接入因特网的接口。设备接入因特网的时间越长,获取的信息越丰富。虽然和充电类似,但数据更新在数据传输中的数据类型和数据量更加复杂。数据的更新必须根据更新设备的能力、更新数据要支持的任务来量身定做。
 
不同的移动用户有不同的数据需求。商务旅行者希望更新合同信息、目的地的旅馆概况和价格等。学生要求访问最近的课程笔记、预习课件、查看实验室公告。数据的更新把用户不同的需求看作特征。特征可以理解为对可用数据的详审找出与用户相关的信息并决定它们对用户的价值。
 
数据更新的特征包括三个类型的信息:首先,特征描述了用户感兴趣的数据类型。这种描述应当式公开的,这样它能够把新创造的数据和已经存在的数据都包含进来。这种描述也应当非常灵活的这样才能够表达不同类型数据和媒体的属性。第二,由于带宽、本地存储容量、数据更新时间的限制,只有一定范围内的数据能够被传输到设备中来。特征还要根据数据的优先级、多个可选项中用户的选项、一致性的要求和其它的特性能够表述用户的偏好。最后,用户的上下文能够动态地和由用户的特征参数化表示的更新过程相协作。
 
我们前面对用户的特征的工作主要关注以下几点:
1)     XML文档流上高效处理特征;2)通过外在的用户的反馈学习和维护用户特征;3)开发移动设备同步大规模的可靠的系统。数据更新是建立在这些工作的基础上,但针对更加意图明显的用户特征(包括用户偏好、上下文信息等)还要开发相应的语言和处理策略。此外,我们还需要开发可为全球众多人口提供数据更新服务的可升级的广域系统体系结构。
 
适应的数据流操作
普适计算环境的另一个关键的方面是数据可用性的不确定和动态数据流的管理操作存在的挑战。例如在移动的应用中,数据根据用户的需要在不同的系统之间移动。当数据在端点生成以后,数据会以不确定的方式流向系统,过程中可能被代理商存储、转发。在有的应用中信息流也会出现,像数据分发系统中新建立数据和修改过的数据发送到用户和缓存中去。
 
传统的数据库查询系统在这种环境中由于以下几个原因而停顿:首先,它们是基于静态的查询优化策略。数据库的查询方案是通过简单的成本模型和对数据的统计来建立的。在动态的数据流环境中,这种方案是不能很好的执行的。因为数据到达的速率、顺序和数据流的行为是难以预测的,从而对数据就没有可靠的统计。
 
第二,现在的方案不足以处理查询操作中的失败。在现在的数据库系统中,数据源的失败没有被检测到,则只是简单的冻结查询操作,以等待数据的到来。如果检测到了数据源的失败,则只是放弃或者重新开始查询。在数据源和流动作不可预测的普适计算环境中这些方法是不恰当的,因为查询操作可能要运行很长时间。
 
第三,现在的查询方案是优化成分批的操作,整个查询的结果作为最后的目标来传输。在普适计算环境中,用户要与系统进行交互,这种策略是不可取的。一旦可以了,处理的数据应当传递给用户。而且,由于是交互的,用户可能要根据前面返回的信息或其它因素来修改查询。系统应当能够根据用户的需求调整变化。
 
加州大学伯克利分校的Telegraph项目通过开发适应性数据流操作引擎来研究这些问题。Telegraph利用一种新颖的策略来执行查询操作。这种策略是基于这样的思想,数据流控制结构把数据逐项发送给查询操作者。Telegraph并不依赖于传统的查询方案,但是允许在查询中应用这些方案。对连续的动态的数据流的查询,系统能够适应于数据到达的速率、数据特征、存储通信资源的可用性等因素的变化。
 
除了新颖的控制结构,Telegraph还使用了非阻塞的均衡的查询处理操作,如Xjoins和Ripple,这些能够处理它们输入数据的变化和不可预测的数据到达。Telegraph系统还存在的问题由基于群的开发、处理引擎的广范围的实现、容错机制的设计、对传感器的连续的查询、基于特征的信息分发和用户接口问题。
 
结论
普适计算是未来一个引人瞩目的现象,它在以越来越快的速度在一步一步地实现更小的、处理能力更强的设备通过有线的或无线的网络相连接组成了全新的应用,改变了现有的计算形式。除了新的设备和通信的机制,实现普适计算的关键技术是数据管理。数据是普适计算应用的核心,这些应用和环境又对数据管理技术提出了新的挑战。
 
在本文中,我尝试着从数据管理的前景来概述普适计算的关键的因素。这些方面归纳成三个方面:1)对移动性的支持,2)上下文感知,3)对协作的支持。我们检查每个因素来找出这些因素对数据管理提出的要求。适应性是这些因素提出的根本的要求。传统的数据管理技术在这种计算环境中被重新考虑。
 
我描述了两个正在进行的项目来检查数据管理中的几个关键的技术:DataRecharging项目的目的是基于复杂的用户的特征提供与移动用户的高度相关的数据的同步和分发。Telegraph项目是开发动态数据流的处理引擎来高效地处理从网络资源到传感器的数据流。
 
当然,数据管理领域中还有很多本文中没有涉及到的问题。首先,多个应用和数据类型之间的协同,这取决于数据交换的标准、资源的发现、对象之间的通信。这个领域有了很大的进展,这些研究只是标准化过程中的一小部分。其次,另一个重要的领域是开发全球范围的、安全的、关于档案的信息存储应用。这种应用的例子是加州大学伯克利分校正在开发的OceanStore系统。
 
总的来说,在可以预见的未来,普适计算给数据管理带来了很多的机会和挑战。我们应当认识到,虽然现在很多关注在于通信的协议研究,但是在普适计算的开发中数据管理扮演着核心的角色。这个领域的进展最终取决于我们解决复杂的数据管理问题的能力。
(李彬编译)


https://blog.sciencenet.cn/blog-39479-213621.html

上一篇:普适计算的过去现在和将来
下一篇:人机交互中的计算机视觉技术
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 19:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部