||
两周前,导师给我讲,科技信息事件的提取建模这个方向很有意思,让我琢磨一下,我看了好几篇论文,现在梳理一下思路:
1. 针对哪些文本信息进行科技事件抽取?
初步构想:针对社交媒体平台上的科技信息进行事件抽取,这种非结构化的信息需要考虑从哪个平台中获取最方便,信息最多,我接触过的平台有:小木虫、科学网、Kaggle、谷歌学术等,现在要考虑从中文社区获取信息还是英文社区,我英语不太行但是英语的或许好抽取事件,能有现成模型可以用
问题拆解:选择社交平台,进行内容爬取
2. 选择哪种NLP模型来提取事件呢?
这部分没想好,因为还没有相关数据和分析的内容
3.将科技事件从社交媒体信息中提取出来,要干什么呢?
猜想:
1)梳理科技发展脉络
2)科技事件舆情分析
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2023-5-28 18:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社