科学出版社分享 http://blog.sciencenet.cn/u/sciencepress 中国最大的综合性科技出版机构之一,科学家的出版社!

博文

为什么人脑能构造或理解无穷多的语句?

已有 7074 次阅读 2018-10-31 14:28 |个人分类:科学书摘|系统分类:观点评述

 

640.jpg


逻辑语义学的研究是一种基础性研究,是实现自然语言计算机信息处理的先期工作。


计算语言学家冯志伟教授在《自然语言的计算机处理》一书中指出:“计算机对自然语言的研究和处理,一般应该经过如下三个方面的过程:


第一,把需要研究的问题在语言学上加以形式化(linguistic formalism),使之能以一定的数学形式严密而规整地表示出来;


第二,把这种严密而规整的数学形式表示为算法(algorithm),使之在计算上形式化(computational formalism);


第三,根据算法编写计算机程序,使之在计算机上加以实现(computer implementation)”。逻辑语义学所做的就是第一和第二方面的工作。

 

在逻辑语义学看来,自然语言句法-语义结构都是通过规则的递归应用,由初始元组合生成出来的。人类语言知识的本质就是语言知识如何构成的问题,其核心是洪堡特(W. von Humboldt)指出的“有限手段的无限使用”。


人脑构造(表述)和理解语言的机制可以概括成两个特征:


1)有穷多的词条作为出发点;


2)依据有穷多规则去构造和理解无穷多的语句。


人脑具有构造和理解自然语言的机制,人就能够构造表述从来没有看见到的句子,也可以理解从来没有听说过的句子,人脑能够构造或理解的句子是无穷多的。


要想机器模拟人脑构造理解自然语言的机制,首先需要在理论上实现语言构造机制的形式化表述,这正是逻辑语义学的任务。

 

逻辑和自然语言的关系密不可分,一方面逻辑研究的对象——思维规律及其推理形式离不开自然语言的表述,另一方面自然语言是逻辑推理的物质载体。


如果说语言是思想表述的载体,那么逻辑就是思想表述的灵魂。从这一角度说,逻辑构成了自然语言的内在骨架。因此,逻辑语义学对自然语言的研究,既是对自然语言规律性的研究,也是对逻辑自身的研究。因此,对自然语言的研究,既是逻辑学在语言研究中的应用,也是逻辑学不断进步的动因之一。

 

例如,范畴语法CG关注自然语言的句法生成(解析)过程,由CG到范畴类型逻辑CTL(categorial type logic)的进步,不仅体现在CTL是对自然语言的句法语义生成过程的工具,而且作为传承延伸逻辑理性主义精神的产物,从理论角度深入讨论逻辑工具本身的性质。


如CTL的公理表述解决系统的可靠性和完全性,CTL的根岑表述解决系统的可判定性。再进而由CTL到组合范畴语法CCG(combinatory categorial grammar),体现了自然语言处理中逻辑思想的进一步深化,具体表现在:


首先,CCG的词汇主义思路关注自然语言以有穷多的词条作为出发点的语言构造机制特征,弥补了大多数逻辑语义学分支如范畴类型逻辑CTL在这方面的短板。


其次,CCG基于规则的思路契合了自然语言依据有穷多规则去构造和理解无穷多语句的构造机制。CCG的核心是一系列的函子范畴的组合规则,这些规则对应了CTL范畴逻辑的结构公设,是函项运算思想的延续,是CTL逻辑定理的延伸。


《自然语言信息处理的逻辑语义学研究》是一部从逻辑学的角度研究自然语言构造机制的专著。作者是以我国著名逻辑语义学专家、中国逻辑学会会长、中国社会科学院哲学研究所邹崇理研究员为核心的一批学者,他们的学术背景包括逻辑学、语言学和计算机科学,但是共同的兴趣是三个领域的交叉地带,即以自然语言信息处理为导向的、依据现代逻辑的思想或采用现代逻辑的工具,研究自然语言的句法生成尤其是语义组合规律,也就是自然语言逻辑语义学(又称为自然语言形式语义学)的研究领域。

 

《自然语言信息处理的逻辑语义学研究》以汉语信息处理为导向,以现代汉语中一些具有典型性的句法-语义现象为研究素材,展开了一系列的逻辑语义学研究。通过揭示这些现象的逻辑语义结构,开展针对汉语独有特征的范畴类型逻辑以及组合范畴语法研究。


这些研究一方面可以充实逻辑语义学研究的理论宝库,促进现代逻辑的发展,另一方面也能够为汉语的计算机信息处理提供指导思想。通过把逻辑语义学对自然语言,尤其是对汉语形式化研究的成果应用到汉语的信息处理领域,将拓宽我国计算机自然语言处理的思路,提高其处理的效率。


作者简介


邹崇理 (1953—)教授,四川成都人。中国社会科学院研究生院哲学博士。现任中国社会科学院哲学研究所研究员,中国社会科学院研究生院教授,博士生导师,湘潭大学和四川大学特聘教授。中国逻辑学会会长,国家社科基金哲学学科评审专家、享受国务院特殊津贴专家。中国人民大学复印报刊资料《逻辑》编委会主任,《逻辑学研究》编委会副主任。主要研究方向为自然语言逻辑和哲学逻辑。著有《逻辑、语言和蒙太格语法》《自然语言逻辑研究》《逻辑、语言和信息》和《范畴类型逻辑》等专著;在Springer出版社的国际逻辑学专业期刊Logic, Rationality and Interaction以及《中国社会科学》英文版、Frontier of Philosophy in China、《哲学研究》、《逻辑学研究》、《自然辩证法研究》、《哲学译丛》、《哲学动态》等期刊发表近100篇学术论文。专著和论文曾获得中国逻辑学会优秀科研成果二等奖和中国社会科学院优秀科研成果二等奖。先后主持或参加21项国家社科基金、国家自然科学基金、中国社会科学院和教育部的科研项目;主持两项国家社科基金重大项目。



本文摘编自邹崇理等著自然语言信息处理的逻辑语义学研究》,内容有删减。


640 (1).jpg


自然语言信息处理的逻辑语义学研究

邹崇理等 著

责任编辑:刘 溪

北京:科学出版社 2018.09

ISBN 9787030563187


自然语言的逻辑语义学(简称逻辑语义学)是依据现代逻辑的思想或采用现代逻辑的工具研究自然语言的句法生成尤其是语义组合规律的学科,是实现自然语言计算机信息处理的先期工作。本书以汉语信息处理为导向,以现代汉语中的反身代词、照应省略结构、话题句、兼语句、连动句、复杂谓词并列结构等具有典型性的句法-语义现象为研究素材,展开了一系列逻辑语义学的研究,即针对汉语独有特征的范畴类型逻辑以及组合范畴语法的研究。这些研究一方面可以充实逻辑语义学研究的理论宝库,促进现代逻辑的发展;另一方面也能够为汉语的计算机信息处理提供理论指导。通过把逻辑语义学对自然语言,尤其是对汉语形式化研究的成果应用到汉语的信息处理领域,我国计算机自然语言处理的思路将得到拓宽,效率将得到提高。


目 录

序言(邹崇理)/i
凡例/iii
导论 1

0.1 自然语言的逻辑语义学 1
0.2 逻辑语义学研究概述 5
0.3 本书研究内容简述 12
参考文献 18
第一编 逻辑语义学研究概论
1 逻辑语义学——自然语言的逻辑研究 21
1.1 作为形式符号系统的自然语言 21
1.2 自然语言的组合性 25
1.3 逻辑语义和自然语言语义 30
1.4 逻辑语义学的研究方向 48
2 面向自然语言信息处理的逻辑语义学 58
2.1 自然语言的计算 58
2.2 部分语句系统的计算思想 61
2.3 范畴语法CG的计算思想 63
2.4 句法语义并行推演的计算思想 68
2.5 结束语 71
参考文献 72
第二编 逻辑语义学的重要理论——范畴类型逻辑CTL
第一部分 范畴类型逻辑GTL梳理

3 GTL的发展历程 80
3.1 AB演算 80
3.2 兰贝克的句法演算 82
3.3 蒙太格的语义分析 83
3.4 新近的发展方向 86
4 GTL的主要理论 90
4.1 传统的CTL——结合的兰贝克演算 90
4.2 多模态的CTL 99
4.3 对称范畴语法 102
5 GTL的其他分支 123
5.1 完全的兰贝克演算 123
5.2 加一元算子的CTL 132
5.3 准群语法与抽象的CTL 134
6 GTL的类型语义学:兰贝克演算匹配λ词项 138
6.1 从经典命题逻辑到兰贝克演算 138
6.2 入演算 144
6.3 哈里-霍华德对应 147
6.4 匹配入词项的兰贝克演算树模式ND表述 159
第二部分 范畴类型逻辑GTL应用于汉语的研究
7 传统CTL对汉语反身代词的研究 162
7.1 带受限缩并规则的兰贝克演算LLC 162
7.2 前后搜索的(Bi) LLC系统 171
7.3 语言学中的应用 181
8 汉语照应省略的范畴逻辑分析 183
8.1 引言 183
8.2 LLC系统与汉语照应省略 185
8.3 LLC系统与空代词 189
8.4 LLCW'系统 196
8.5 LLCW' 统的特色及语言学检验 222
8.6 结束语 227
9 基于多分法的GTL 229
9.1 多分法的逻辑学依据 230
9.2 多分法的语言学依据 235
9.3 基于多分法的CTL系统 246
9.4 匹配入项的工作 253
9.5 结束语 256
参考文献 258
第三编 逻辑语义学的重要应用——组合范畴语法CCG
第一部分 组织范畴语法CCG梳理

10 组合范畴语法CCG综述 264
10.1 引言 264
10.2 AB演算的缺陷 268
10.3 原生态CCG 272
10.4 多模态CCG 285
10.5 组合范畴语法与范畴类型逻辑之联系 294
11 CCG的计算语言学价值与CCG树库 317
11.1 CCG的计算语言学价值 317
11.2 英语CCG树库 318
11.3 汉语CCG树库 343
12 CCG处理自然语言存在的困难和问题 349
12.1 CCG处理自然语言的局限 349
12.2 使用CCG分析自然语言语义面临的闲境 358
12.3 添加CCG句法分析树缺失的语义表述存在的困难 361
第二部分 组合范畴语法CGG研究
13 GGG对汉语非连续结构的处理 367
13.1概述 367
13.2 CCG对汉语NCC结构的处理 371
13.3 CCG对汉语话题句的处理 374
13.4 汉语连动句和复杂谓词并列结构的处理尝试 378
14 组合范畴语法对汉语形容词谓语句的处理 381
14.1 汉语形容词谓语句的定义和分类 38l
14.2 汉语光杆形容词谓语句的组合范畴语法分析 381
14.3 汉语复杂形容词谓语句的组合范畴语法分析 383
15 组合范畴语法对汉语主谓谓语句的处理 389
15.1 汉语主谓谓语句的语法结构及语法特征 389
15.2 汉语主谓谓语句的组合范畴语法分析 389
第三部分 汉语GGG研究的计算机实现(汉语GCGbank的构建)
16 组合范畴语法的计算语言学价值 398
16.1 面向大规模自然语言处理的形式文法综述 398
16.2 CCG适用于计算语言学的特性 402
16.3 CCG的应用 412
17 汉语CCG研究 420
17.1 范畴的构造与组合规则 420
17.2 与名词短语相关的范畴分析 425
17.3 与动词相关的范畴分析 428
17.4 标点与并列的范畴分析 435
17.5 句子层面的范畴分析 439
18 从宾州汉语树库转汉语CCGbank 444
18.1 介绍 444
18.2 汉语CCGbank转换系统的架构与设计 450
18.3 汉语CCGbank核心转换算法 457
18.4 汉语CCGbank的鲩计与分析 475
参考文献 478
附录1 宾州汉语树库( PGTB)的标签集 485

A1.1 词性标签Part Of Speech tags (33) 485
A1.2 句法标记(23) 486
附录2 “的”在汉语CCGbank中的范畴 488
汉英术语、人名对照表 491


640.png

长按二维码 购买本书


(本期编辑:安 静)


640 (3).jpg

一起阅读科学!

科学出版社│微信ID:sciencepress-cspm

专业品质  学术价值

原创好读  科学品味

更多好素材,期待您的来稿

与科学相约 | 科学出版社征稿启事



https://blog.sciencenet.cn/blog-528739-1143766.html

上一篇:《中国科学》《科学通报》2018年度优秀编委、优秀作者和优秀编辑评选揭晓
下一篇:大数据时代,数据分析会触碰到什么?
收藏 IP: 124.17.26.*| 热度|

7 黄荣彬 罗娜 张成岗 黄永义 迟延崑 shenlu zjzhaokeqin

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 04:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部