章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

专题:情报学方法体系构建中的关键技术研究

已有 4553 次阅读 2019-11-26 15:26 |个人分类:文本挖掘|系统分类:论文交流

     《情报学方法体系构建中的关键技术研究》专题序言

       研究方法是促进学科发展与深入研究的重要推动力, 在科学研究过程中扮演着举足轻重的作用。对于情报学这一相对较新的领域, 研究方法的重要性不言而喻。国内外的情报事业经过多年的发展, 为情报学研究提供非常丰富的实践资源。情报学在研究实践中, 已初步形成众多的学术流派、学科基础理论和研究方法。当前, 情报学与情报工作中, 亟需对情报学的相关方法体系进行梳理, 形成系统的情报学方法体系, 从而为情报学研究与情报工作提供指导。

       在当前的大数据环境下, 情报学方法不断出现新变化、产生新内容、呈现新特点。因此, 确定被广泛承认的情报学科基本内核, 变得非常困难; 探索已有理论和方法的新变化, 需要新的技术手段加以辅助; 归纳提取不同领域与应用场景中所使用的情报学方法与技术共性, 需要新的思路。在此背景下, 笔者组织了4篇专题论文, 研究主题涉及特定场景下的情报学方法体系构建、创新研究评价句抽取、研究方法实体识别、以及方法论知识抽取系统构建等。

       特定场景下的情报学方法体系构建方面, 《基于“过程-问题”视角的情报学方法技术研究——以社会情报学舆情领域为例》一文, 从“过程-问题”视角重新组织情报学方法技术, 构建基于大规模文献的情报学方法术语获取和组织模型, 并对模型中各主要模块的实现进行探讨和实验, 结果表明从“过程-问题”视角组织情报学方法技术对于情报问题的解决具有指导作用。

       创新研究评价句抽取方面, 《基于学术论文全文的创新研究评价句抽取研究》一文, 采用学术期刊论文全文作为实验数据, 通过能表征创新研究评价的标志词自动地从学术论文全文中抽取评价句, 并分别从评价句标志词、类型和所在位置等角度分析评价句的分布情况。基于学术论文全文的评价句的抽取与分析, 构建评价句知识库, 为学者调研相关研究、撰写综述提供帮助, 可为评价科研成果提供新的思路。

       研究方法实体识别方面, 《基于深度学习的情报分析方法识别研究——以安全情报领域为例》一文, 以安全情报领域文献为数据来源, 对文献全文本进行汉字级的语料标注, 构建安全情报领域情报方法语料库, 对情报方法实体进行识别。通过归纳总结安全情报领域情报方法的特点, 不仅有助于科研工作者了解该领域情报方法的构成, 而且可为其他领域的方法实体识别与抽取提供参考。

       方法论知识抽取系统构建方面, 《面向学术文献全文本的方法论知识抽取系统分析与设计》一文, 介绍面向学术文献全文本的方法论知识抽取系统的构建思路及功能模块, 并实现方法论知识抽取模块的开发。方法论知识抽取与系统的构建, 为方法实体、方法句等不同粒度知识的深入应用提供基础。

       本专题论文是国家社会科学重大项目“情报学学科建设与情报工作未来发展路径研究”的系列研究成果之一。随着自然语言处理、机器学习、信息检索等技术的不断发展与学科研究方法的不断丰富, 针对学科方法实体、方法句等知识的抽取、分析、评价及应用的相关研究将不断深入。本专题旨在抛砖引玉, 同时也企盼相关领域学者加强合作, 进一步推动该研究方向的发展。

                                                                                                 (章成志,南京理工大学)

----------------------------------------------------------------------------------------------------------------

      4篇专题论文具体介绍如下:

1. 基于“过程-问题”视角的情报学方法技术研究——以社会情报学舆情领域为例

朱惠,王昊,章成志
摘要 【目的】基于大规模情报学文献了解中国情报学方法技术并探讨如何从“过程-问题”这一新视角组织这些方法技术。【方法】构建“过程-问题”视角下的情报学方法技术术语获取和组织模型: 解析情报过程及其包含的情报问题; 标注文献所属的情报问题; 分别采用基于词典和基于模板的抽取方法获得方法技术术语并将结果融合; 最终按过程、问题组织这些方法技术。【结果】运用上述方法获得按过程、问题组织的情报学方法技术术语, 验证了模型的可行性和有效性, 术语抽取的F1值达到90.91%。【局限】仅从CNKI采集实验数据, 对结果的全面性有影响; 情报学方法技术术语抽取模板还有待完善。【结论】词典和模板相结合的抽取方法可以较好地获取情报学方法技术术语; 从“过程-问题”视角组织情报学方法技术对于情报问题的解决具有指导作用。
全文:http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I10/2

2. 基于学术论文全文的创新研究评价句抽取研究

章成志,李铮
摘要 【目的】依据学术论文全文抽取创新研究评价句, 分析创新研究评价句的特征与规律。【方法】以图书情报档案学科为例, 将学术期刊论文全文作为实验数据, 通过选取标志词、制定抽取规则抽取创新研究评价句。分别从标志词、类型、位置等方面分析创新研究评价句的分布情况。【结果】抽取的创新研究评价句主要可分为6个类型, 大多出现在论文前24.8%的位置。【局限】创新研究评价句的抽取方法有待优化。【结论】图书情报档案领域的创新研究评价句以概念理论类为主, 不同期刊的评价句类型也存在差异, 模型方法类的评价句位置分布较为分散。
全文:http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I10/12

3. 基于深度学习的情报分析方法识别研究——以安全情报领域为例

肖连杰,孟涛,王伟,吴志祥
摘要 【目的】对安全情报领域情报分析方法进行识别、归纳与总结, 为构建安全情报领域情报分析方法体系提供参考。【方法】以安全情报领域文献为数据来源, 对文献全文本进行汉字级的语料标注, 构建安全情报领域情报分析方法语料库, 在此基础上利用深度学习模型对情报分析方法实体进行识别。【结果】在安全情报领域情报分析方法语料库上进行实体识别对比实验, BiLSTM模型的情报分析方法实体识别准确率81.71%, 召回率77.26%,F1值79.36%; BiLSTM-CRF模型的情报分析方法实体识别准确率84.71%, 召回率79.25%, F1值81.83%。【局限】未考虑句子中包含情报分析方法的指代名词, 可能会对统计结果产生一定的影响。【结论】利用深度学习方法对安全情报领域情报分析方法实体进行识别是可行且有效的。
全文:http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I10/20

4. 面向学术文献全文本的方法论知识抽取系统分析与设计

徐浩,朱学芳,章成志,江川
摘要 【目的】面向学术文献全文本抽取方法论实体, 识别其在全文本中的标引特征及使用环境。【方法】基于字典、规则及人工标注的方式抽取包含方法论知识的特征句及方法论实体, 借助Visual Studio 2012及SQL Server 2012实现方法论实体抽取核心功能模块。【结果】方法论特征句抽取的准确率为76%, 召回率大于42%; 每个特征句中约包含1.42个方法论实体, 方法论实体的正式标引比率低于27%, 对特征句的正式标引比率低于35%, 学科专用工具的正式标引率较低。【局限】系统特征句抽取准确率及召回率均较低, 虽提供了人工标注界面加以辅助, 但工作量较大, 未基于语句关系等方法论知识的语义特征进行命名实体识别。【结论】学科专用方法论知识的学术价值被忽视; 本研究所设计的方法论特征句及实体抽取方法具备多学科通用性, 可进一步探讨方法论驱动的跨学科知识扩散路径。
全文:http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I10/29



http://blog.sciencenet.cn/blog-36782-1207655.html

上一篇:Information Discovery with Machine Intelligence for Language
下一篇:利用在线评论文本研究大众的食与行

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2020-1-28 19:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部