数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

大数据与中国古村落保护

已有 2699 次阅读 2018-2-20 11:36 |个人分类:人文社科|系统分类:人文社科| 大数据, 古村落, 传统村落


前 言

   作为村落中拥有着最为丰富的历史文化信息的“古村落”,是传承历史、建筑、民俗、民间艺术等多方面文化遗产的重要载体,是整个中华民族不可再生的文化资源。然而,“古村落”这一概念在相当长一段时间内并未真正进入官方视野之中,直至迈入21世纪前后,“古村落”一词才开始广泛见诸报端,相伴出现的多是“所剩无多”、“严重毁坏”等关键词,更有学者疾呼“古村落是中国最大的文化遗产”、“古村落是民间文化最后的防线”。此后各类保护机构和学术研究团队也陆续出现。从2007年10月起,广东省文学艺术界联合会和广东省民间文艺家协会在全国率先发起了省级古村落抢救、保护专项工作,制定了《广东省古村落认定标准及调查内容纲要》,主要是在全省范围内对清代及以前形成并现存至今具有较高历史文化、艺术和科学价值的古村落进行了普查、认定等抢救性工作。在2008年、2009年、2012年、2015年、2016年,分别向社会公布、推荐了五批广东省古村落共296个(第一批27个、第二批37个、第三批140个、第四批47个、第五批45个),同时与南方日报社联合策划了“寻找广东最美古村落”活动,得到了社会的广泛关注。2012年,住房和城乡建设部、文化部、财政部组织开展了全国第一次传统村落摸底调查,将具有重要保护价值的村落列入中国传统村落名录。目前 全国共有4153个村落列入中国传统村落名录。

   然而就现状而言,我国古村落研究尚处于资料整理、理论探索阶段,未形成成熟完整的理论体系,交叉学科的力量整合尤显不足。尤其在新信息时代的背景下,对于公众参与的开放性平台、数字化的大数据架构更是提出了新的需求,如果仍只限于延续旧有的古村落保护手法和模式,必将使我国古村落文化保护工作更为滞后。有鉴于此,华南理工大学出版社、广东省民间文艺家协会、大连理工大学系统工程研究所、华南理工大学软件学院、华南理工大学企业信息与知识管理研究中心向财政部联合申报并通过了“基于大数据架构的中国古村落文化保护与传承云服务平台建设”国家文化产业发展专项基金项目。中国工程院院士、华南理工大学建筑学院名誉院长何镜堂教授,中山大学党委书记、著名历史人类学学者陈春声教授分别作了项目推荐意见书;国内系统工程学科创建者之一,中国工程院院士王众托教授领衔指导平台的系统研发工作。项目拟通过大众化知识生产模式的思想和相关技术,构建一个以广东古村落为主要案例的古村落历史文化保护与传承大数据平台应用示范;实现海量历史文字资料、图片资料、音频和视频资料的数字化挖掘、整理、标注、分类等工作;并基于开放性的平台提供诸如专业数据深度挖掘、内容标引、专题知识检索及按需出版等多方面的知识服务。

   在项目的申请过程中,政府层面与学术界层面对我国古村落现状越发达成了这样的一个共识:即古村落文化资源在中国文化资源中占有重要地位,而在当前却遭受到濒临消亡的危机,抢救与保护中国古村落文化资源迫在眉睫。故此,通过信息技术手段,对我国古村落文化资源进行挖掘、梳理、保存、推广,探讨古村落文化传承与保护的新模式,将为国内外的古村落研究者带来极大便利,亦对我国各地古村落的保护和开发工作有着极好的示范作用;这也是本项目实施的意义所在。

   作为项目的协作单位之一,大连理工大学系统工程研究所数据科学与知识管理团队承担了“面向古村落文化保护与传承云服务平台的数据分析与知识挖掘”子课题。2014年3月24-25日,第四届中国古村落保护与发展研讨会在广东省佛山市西樵镇松塘村召开,并启动了《基于大数据架构的中国古村落文化保护与传承云服务平台建设》,作者应邀以《大数据与古村落保护——信息资源视角》为题做了大会报告。2016年9月27-29日,第二届中国古村镇大会在山东滨州举行,作者应邀以《基于大数据的古村落文化遗产数字化保护与传承研究》为题在主题论坛《破冰:智慧古村镇》上做了主题报告。2016年12月份,课题组向项目牵头单位华南理工大学出版社和协作单位广东省民间文艺家协会汇报了课题进展和取得的研究成果,得到了华南理工大学出版社原社长韩中伟先生和中国民间文艺家协会副主席、广东省民间文艺家协会主席李丽娜女士的肯定和好评,并鼓励作者将研究成果以专著形式出版,扩大国家文化产业发展专项基金项目成果的社会影响力。古村落研究涉及的领域和学科非常广泛,具有交叉学科属性,作者及所在团队的主要研究方向是系统工程、数据科学、信息与知识管理,因而本书从大数据分析与挖掘视角来开展古村落研究,为古村落研究增加一个新的视角和维度。

大数据、云计算等新一代信息技术的迅猛发展,为古村落文化遗产保护与传承提供了新的思路与工具。利用大数据技术以及网络众包模式来研究古村落保护与传承问题,是一种“跨界”和“混搭”,其探索意义在于“去粗取精”和“合纵连横”,最终实现1+1远大于2的信息化价值目标。古村落文化遗产的数字化保护与传承,获得大量的古村落数据信息是第一步。有了古村落大数据,还需要利用大数据分析技术把碎片化的数据进行分析和挖掘,从而产生有价值的信息和知识。大数据分析技术包括描述性分析、预测性分析和规范性分析,本书主要应用描述性分析方法,特别是应用聚类分析方法对古村落大数据分析与挖掘进行了初步尝试,得到了部分有意义的结果,现将这些方法与结果整理出来,希望能够为古村落研究者提供一种新的思路与方法。

本书共有十章,各章的内容、主要观点和结论如下:

第一章“中国古村落文化遗产保护”介绍了古村落与传统村落的概念辨析、古村落物质文化遗产与非物质文化遗产以及古村落文化遗产的数字化保护。古村落保护和发展是一项复杂的系统工程,提出将古村落文化遗产的数字化保护问题看作由三个空间耦合关联而成的古村落复杂系统综合集成问题,借助于信息技术和相关设备,采用不同类型的数字化方法,将古村落物质文化遗产和非物质文化遗产的各种信息数字化,并永久存储于信息世界中,以实现三个空间的有机融合,进而达到对古村落文化遗产的抢救保护与弘扬。

第二章“中国古村落文化保护与传承云服务平台”介绍了古村落大数据和基于大数据架构的中国古村落文化保护与传承云服务平台建设文化产业专项资金项目古村落数据涵盖了大量历史、人文与社会经济信息,呈现出容量大、多来源、多格式、多类型等特点,是典型的大数据,包括古村落物质文化遗产大数据、非物质文化遗产大数据和古村落网络大数据基于大数据架构的中国古村落文化数字化保护与传承云服务平台是一个知识服务系统,因而项目组提出以知识系统工程方法论为指导来开展研发、构建和运营活动。

第三章“基于网络众包模式的古村落大数据采集”介绍了如何应用网络众包模式开展古村落大数据采集工作。网络众包模式是一种大众化知识生产模式,基于网络众包模式的古村落大数据采集及处理方法,可以实现海量文字资料、图片资料、音频和视频资料的数字化采集、分类、标引等工作。通过网络众包模式,将更多的闲置资源充分集结到一起共同完成同一项事情,使得任务量庞大的古村落大数据采集工程的实现成为了可能。

第四章“古村落文献知识图谱分析与主题发现”从知识图谱和主题发现两个方面对古村落文献进行计量分析,探索国内对古村落研究的现状和特点,得出古村落知识图谱领域主题,为古村落研究领域的科学研究提供参考。在进行古村落文献主题发现时,针对传统共词分析方法存在的缺陷,提出了基于AP聚类的GMAP共词分析方法,数据预处理阶段使用g指数和互信息概念,在聚类分析阶段使用AP聚类方法,最后得出领域主题。

第五章“古村落领域文献主题演化分析”在第四章“古村落文献知识图谱分析与主题发现”基础上,进一步深入研究古村落领域文献的主题动态演化情况,提出了基于GMAP共词分析法的主题演化框架,从而探究广大学者们对古村落进行哪些方面的研究,古村落领域的主题又是随着时间如何演化的,并将研究结果用ThemeRiver模型进行可视化,最终将主题演化结果直观地展示出来,并从宏观和微观两个层面对主题演化状态进行分析。

第六章“传统村落地理位置可视化与空间分布特征”以入围中国传统村落名录的广东省160个传统村落为研究对象,运用空间统计分析和数据挖掘中的聚类分析方法,对广东省传统村落的密度分布、地理集中指数、空间自相关性、地理位置可视化和村落群聚类结果进行研究,以期能对广东省传统村落的合理开发、利用和保护提供参考。研究发现广东省传统村落主要集中于珠三角地区和粤北地区,在地理分布上呈现珠三角、粤北分布多,粤东、粤西分布少的规律;传统村落较集中分布于某些地级市,且前三批随批数增加,集中程度越大,前四批的集中程度比前三批的稍有降低。

第七章“古村落网络资源评价方法与网络传播力”提出了一种古村落网络信息资源评价流程框架,通过评价古村落网络信息资源来衡量古村落的网络传播力。以广东省204个古村落为计算实例,使用古村落网络资源评价方法得到了一个相对准确合理且具有管理参考价值的综合评价结果。通过探究发现排在前十名的古村落较多位于广州市,广东省古村落在百度百科词条和数字地图方面的资源相对丰富,在旅游网站和新闻数量上的资源丰富程度一般,在古村落主页和中国知网上的资源相对匮乏。

第八章“古村落特征提取与古村落画像”介绍了如何从大量古村落网络信息资源中抽取最能反映和代表古村落特征的有用信息,并依据这些有用的信息完成古村落的画像。在广泛的古村落网络信息资源中,文本数据是最为普遍的一种数据类型,对于挖掘古村落特征具有重要价值。首先,通过制定古村落候选特征的筛选原则,采用文本挖掘方法进行古村落特征抽取;然后,依据古村落特征,总结村落的特点,生成古村落画像,并分别从两个不同方面对村落画像进行特征维度分析和特征相关性分析;最后,以小洲村为例进行了实例计算及相关结果分析。

第九章“基于AP聚类的古村落视频与图像数据挖掘”介绍了如何通过AP聚类等技术对古村落视频和图像两类重点的影像资料进行挖掘和分析。将增量式AP算法应用于古村落视频数据聚类,生成的视频摘要可以帮助历史学家和民俗专家在短时间内把握大量视频的内容概要,进而把握古村落的总体特征以及古村落之间的区别和联系。将基于AP聚类的任意形状簇聚类应用于聚类古村落图像数据,通过图像分割的方法,描绘出图像的大致轮廓,从而便于民俗专家研究工艺品的艺术风格。

第十章“广东省古村落信息管理原型系统设计与实现”介绍了广东省古村落信息管理原型系统的需求分析、系统设计与系统实现。利用信息系统分析与设计的相关理论,对广东省古村落独有的特性进行全面需求分析;在需求分析的基础上,确立了广东省古村落信息管理原型系统的采集目标和系统的使用对象,根据古村落现有的建筑、艺术、民俗、活动等信息进行表格的设计,并根据不同类型用户的需求进行相应的数据库设计。在数据库和目标设计基础上,利用现有的HTML5网页开发技术、JSP动态网页开发技术以及数据库技术,完成了广东古村落信息管理系统的原型系统的设计与开发。

本书主体内容是在《面向古村落文化保护与传承云服务平台的数据分析与知识挖掘结题报告》基础上完成的,课题研究和结题报告撰写以及专著成稿阶段,得到了大连理工大学系统工程研究所数据科学与知识管理团队党延忠教授、吴江宁教授、潘东华副教授和华南理工大学企业信息与知识管理研究中心各位老师的大力支持。本书第三章的内容为华南理工大学企业信息与知识管理研究中心的课题研究成果,考虑到本书的完整性,也将其纳入书中,在此特别感谢席运江副教授、刘勇副教授和李志宏教授的支持。作者指导的部分博士生、硕士生和本科生也参与到课题研究之中,其中博士生魏伟参与了第三章和第四章的撰写,硕士生曹梦月参与了第四章和第五章的撰写,硕士生李敏谦参与了第六章、第七章和第八章的撰写,博士生孙磊磊和硕士生那珍娜参与了第九章的撰写,硕士生刘婷婷和本科生张佳峰参与了第十章的撰写和原型系统开发。参与课题研究的各位老师和各位博士生、硕士生和本科生对本书的手稿准备工作做出了重要贡献,在此作者表示衷心感谢。

本书从选题、建构、写作到完稿一直得到许多专家学者和领导的关注和支持,从他们的交流中得到了很多教益。特别要感谢国内系统工程学科创建者之一,中国工程院院士王众托教授,作为项目和课题的顾问,他不但对全书的组织架构给以指导,而且细心地审读了全书文稿,指出了内容和文字中的疏漏和有待改进之处,并为本书作序,他的认真负责精神使作者深为铭感。感谢中国民间文艺家协会副主席、广东省民间文艺家协会主席李丽娜女士对作者的鼓励,感谢华南理工大学出版社原社长韩中伟先生对作者的鞭策,感谢广东省民间文艺家协会陈周起先生和朱琪女士提供的广东省古村落相关资料,感谢华南理工大学出版社社长卢家明、副社长乔丽、副总编潘宜玲、数字出版中心主任陈超对课题研究和专著出版的大力支持。还要衷心感谢赖淑华编审和蔡亚兰编辑在本书筹划、组织与出版过程中付出的辛勤劳动。

古村落与文化遗产保护是一门交叉学科,作者从事这一学科的研究时间很短,自己的理论水平、实践经验和学术眼界也都还有限,撰写本书确实是一种大胆尝试,书中的观点、提法和叙述肯定有不妥甚至谬误之处,恳请读者多加批评指正!




http://blog.sciencenet.cn/blog-34250-1100463.html

上一篇:基于客户行为的4S店客户细分及其变化挖掘
下一篇:“大数据与智能决策”讨论班——计算社会科学

3 王启云 武夷山 章成志

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-9-23 05:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部