精选
||
在1949年的一篇神文中,瓦伦韦弗(机器翻译的鼻祖,数学家,二战时帮助防空与轰炸,撰写电磁场教科书,担任洛克菲勒基金会主任,投资医学和生物领域,并提出分子生物学)受香农信息论的启发,深刻揭示了信息论、玻尔兹曼、大语言模型甚至量子力学的联系,并提出了目前大热的语义通信概念。他虽然一开始提出了通信的三个层次:传输、语义、效果,但通篇神文其实一直在论证的是(也在最后明确指出):虽然乍一看香农信息论主要解决传输问题,但其中的理论与数学工具(熵、统计)很可能也可以用来解决语义和效果层次的问题,这也是他认为香农的信息论意义重大的原因。
人机交互中的通信问题除了数据、数学问题,还有不少非数据、非数学问题,其中,人机通信的非数学理论是跨学科的综合性理论体系,涵盖认知科学、心理学、语言哲学、交互设计、社会文化等多个维度,其核心是理解人类与机器交互中的意义建构、情境适应、情感共鸣与社会协同,而非依赖数学模型或统计推理。
一、认知科学与心理学理论:理解人类认知过程,构建“以人为中心”的交互
认知科学与心理学是人机通信非数学理论的核心基础,其目标是揭示人类感知、记忆、思维、决策等认知过程,为机器设计提供“符合人类认知习惯”的交互逻辑。
1. 情境认知(Situated Cognition):强调人类认知依赖于具体情境,意义的建构需结合环境、任务与互动历史,加州大学伯克利分校的研究发现,人类沟通时需借助“社会背景”(如对话场景、过往经验)理解模糊信息(如“bank”的多义性);婴儿与父母通过手势在非语言情境中实现有效沟通,正是因为共享了情境意义。这一理论要求机器具备上下文感知能力,能根据对话场景(如医疗咨询 vs. 日常聊天)调整交互策略。
2. 共同意义框架(Common Meaning Framework):人类通过“动态思想框架”实现相互理解,即大脑右颞叶区域会建立“共识区”,实时测试对方的意图并更新共同意义。例如,在无声游戏中,玩家通过动作沟通时,右颞叶活性随共识建立而增加。这一理论要求机器具备动态意义协商机制,能通过多轮交互逐步构建与用户的共同理解,而非依赖静态统计模型。
3. 分布式认知(Distributed Cognition):认知过程不仅发生在人类大脑,还分布于工具、环境与互动伙伴中。人类使用地图导航时,认知过程涉及地图(工具)、路线(环境)与自身记忆(大脑)的协同。这一理论推动了多模态交互的发展,要求机器整合语音、手势、视觉等多通道信息,构建“人机协同”的认知系统。
4.弥聚式认知:是人类认知过程中分布式与集中式动态平衡的核心机制,既通过分布式的广泛信息收集与并行处理(如感官感知、边缘计算、群体智能体的自主决策)实现对复杂环境的灵活适应,又通过集中式的整合与决策(如前额叶皮层的逻辑分析、云端系统的价值权衡、伦理规则的全局应用)确保信息的有效聚合与目标的统一,最终形成“个体自主-群体协同”“事实弥散-价值聚合”的辩证统一,支撑人类在复杂场景中实现高效、合理且符合伦理的认知与决策。其核心逻辑在于,分布式认知通过多节点、多通道的信息扩散(如传感器网络、神经网络的并行处理、人机交互中的多模态输入),实现对环境信息的全面覆盖与实时响应,避免单一中心的僵化与信息过载;集中式认知则通过核心机制(如大脑的决策中枢、云端的全局模型、伦理规范的统一应用),对分布式信息进行筛选、整合与升华,确保认知结果的连贯性、逻辑性与价值一致性。二者的动态平衡,使得人类认知既能应对动态变化的复杂环境(如自动驾驶中的实时路况处理),又能坚守核心价值(如“保护生命优先”的伦理判断),实现“效率与公平”“灵活与稳定”的协同。弥聚式认知模式不仅解释了人类智能的灵活性(如群体决策中的创意激发与最终共识的形成),也为人机融合智能、群体智能系统等领域的设计提供了关键指导——通过模拟人类的“弥聚式认知”,可以实现机器系统的高效信息处理与价值对齐,推动“人机共生”目标的实现。
二、语言哲学与符号学理论:超越符号本身,关注意义的社会建构
语言哲学与符号学研究“意义如何产生”,其核心是符号互动(Symbolic Interaction),即人类通过符号(语言、手势、表情)传递意义,而意义是社会建构的。
1. 维特根斯坦“语言游戏”理论:语言的意义在于“使用”(Use),而非“指涉”(Reference)。比如,“卧倒!”的指令意义不是“躺下”本身,而是“应对危险”的行动触发。人机对话中,语言不仅是交流载体,更是计算过程的触发机制(如“发送邮件”→ API调用),但机器需理解“意向性”(Intentionality),而非仅执行符号逻辑。
2. 塞尔“制度事实”理论:语言意义依赖于“制度性语境”(Institutional Context),如“货币”的意义源于社会约定。人机对话中,AI需嵌入社会制度(如医疗、法律场景),理解术语的文化差异(如“database”在SQL与普通语言中的不同含义)。例如,医疗AI需区分“症状描述”与“医学术语”,避免因语境缺失导致的误解。
3. 符号互动论(Symbolic Interactionism):人类通过符号互动形成“自我”与“社会”,意义的建构是“主我”(I)与“客我”(Me)的对话,如用户与机器交互时,“客我”是机器的反馈,“主我”是用户的意图,二者通过符号(如语音、文本)互动形成“共同意义”。这一理论要求机器具备情感共鸣能力,能通过符号(如语调调整)回应用户的情感状态。
三、交互设计与社会文化理论:构建“有意义的关系”,融入社会语境
交互设计与社会文化理论关注“人机关系的意义”,其核心是以人为本(User-Centered Design),强调机器需适应人类的社会文化与情感需求。
1. 交互设计的“可用性”与“用户体验”:交互设计的目标是提升产品的“可用性”(Usability,即易用、高效)与“用户体验”(User Experience,即愉悦、满足)。例如,ISO 9241/11标准定义可用性为“容易学习、容易使用、系统有效、用户满意”,而用户体验则强调“超出预期的惊喜”(如智能助手的个性化推荐)。这一理论要求机器设计需尊重用户的心智模型(Mental Model),即用户对机器功能的理解(如“按钮=执行命令”),避免“机器中心”的设计。
2. 社会文化嵌入(Sociocultural Embedding):人机交互需融入社会文化语境,考虑用户的背景(教育、文化、民族)。例如,左撇子用户的使用习惯与普通人不同,需调整界面设计;跨文化交互中,“点头”的含义(同意 vs. 否定)需根据文化背景调整。这一理论要求机器具备文化适应能力,能通过用户画像(如年龄、地域)调整交互方式。
3. 机器身体化(Machine Embodiment):机器的“身体”是意义共创的前提,分为三种类型:①适应人类身体(如 ergonomic 鼠标,符合人体工学);②拥有机械躯体(如工业机器人,具备物理操作能力);③成为机器主体(如智能机器人,具备自主意识)。例如,服务机器人的“身体”需适应人类的生活场景(如家庭中的扫地机器人,需避开障碍物),而工业机器人的“身体”则需满足生产场景的需求(如焊接机器人的精准操作)。这一理论推动了具身智能(Embodied Intelligence)的发展,要求机器通过“身体”与人类实现“共在”(Co-Presence)与“共通”(Co-Understanding)。
四、多模态交互与情感计算理论:整合非语言信息,实现“自然交互”
多模态交互与情感计算理论关注“人类与机器的情感共鸣”,其核心是非语言信息的整合(如语音、手势、表情),实现“像人与人一样自然”的交互。
1. 多模态交互(Multi-Modal Interaction):人类通过语音、手势、眼神、表情等多种通道传递信息,机器需整合这些通道的信息,实现“无缝交互”。例如,微软Kinect通过识别手势、语音与体感,实现多通道信息处理;智能助手通过语调调整(如温柔的语气)传递情感,提升用户体验。这一理论要求机器具备多通道信息融合能力,能将语音(内容)、语调(情感)、手势(意图)整合为统一的“意义”。
2. 情感计算(Affective Computing):机器需识别、理解与回应用户的情感状态(如高兴、愤怒、悲伤),实现“情感共鸣”。例如,情感识别技术通过分析语音(如语速、音调)、面部表情(如皱眉、微笑)识别用户情感,调整交互策略(如用户愤怒时,机器用更温和的语气回应)。这一理论要求机器具备情感建模能力,能通过机器学习(如深度学习)识别情感模式,并生成符合人类情感习惯的反馈。
五、人机通信非数学理论的核心逻辑
人机通信的非数学理论的核心是“以人为中心”,即从人类的认知、语言、社会文化与情感需求出发,构建“有意义的人机关系”。其关键逻辑包括:①意义建构,通过情境认知、共同意义框架与符号互动,实现机器与用户的意义协商;②情境适应,通过分布式认知、社会文化嵌入与多模态交互,适应人类的生活场景与社会语境;③情感共鸣,通过情感计算与机器身体化,实现机器与人类的情感互动;④协同进化:通过交互设计与认知科学,推动机器与人类的“协同进化”(如AI从工具性交互向认知协同演化)。
这些理论共同构成了人机通信的“非数学基础”,为智能机器(如智能家居、人形机器人)的设计提供了“符合人类习惯”的指导,推动人机交互从“机器中心”向“人类中心”转型。未来,随着具身智能、多模态交互等技术的发展,非数学理论将进一步深化,推动人机关系从“交互”向“交往”“交流”进阶,实现“人机共生”的目标。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-1-21 22:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社