科学网

 找回密码
  注册
《 时间序列数据挖掘》图书简介
郭崇慧 2023-2-9 10:21
前言 随着社会经济和信息技术的发展,时间序列的数据量增长越来越快,相应地,利用数据挖掘技术在时间序列数据库中发现潜在的有价值的信息和知识也备受关注,其研究成果已被成功地应用于经济、金融、电子信息、医疗卫生、教育、工业和工程等领域。然而,时间序列数据的特征表示和相似性度量是时间序列数据挖 ...
个人分类: 科研笔记|1367 次阅读|没有评论
数据预处理——异常值识别和缺失值填补
郭崇慧 2020-4-29 11:01
一、什么是异常值?什么是缺失值? 异常值,又称离群点(outlier),是指数据集中存在不合理的个别值,其数值明显偏离所属样本的其余观测值。一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。 缺失值(missing value):现有数据集中某个或某些属 ...
个人分类: 科研笔记|13070 次阅读|没有评论
非线性+网络:2020研究热点综述
郭崇慧 2020-4-11 15:43
非线性+网络:2020研究热点综述 文献:Mason A. Porter. Nonlinear+Networks: A 2020 Vision. arXiv:1911.03805 2019 网络科学日新月异,网络科学大会ER奖得主、加州大学洛杉矶分校数学教授Mason A. Porter在这篇综述论文中指出了未来网络研究的四个热点,分别是:1)时序网络(网络中的实体或实体间的关系随时 ...
个人分类: 科研笔记|3861 次阅读|没有评论
图说疫情:辽宁省疫情风险分区分级探讨与对策建议
郭崇慧 2020-2-27 13:17
辽宁省疫情风险分区分级探讨与对策建议 郭崇慧,刘沐灿,左玉倩 (1.大连理工大学 大数据与智能决策研究中心, 辽宁 大连, 116024) (2.大连理工大学 经济管理学院 系统工程研究所, 辽宁 大连, 116024) 【摘要】本文基于轨迹挖掘、真值发现、可视化等大数据技术对公开的辽宁省确诊病例多源异构信息融合 ...
个人分类: 科研笔记|10082 次阅读|没有评论
数说新冠:辽宁省新型冠状病毒肺炎疫情统计分析
郭崇慧 2020-2-21 11:39
辽宁省新型冠状病毒肺炎疫情统计分析 郭崇慧 1,2 ,左玉倩 1,2 (1.大连理工大学 大数据与智能决策研究中心, 辽宁 大连, 116024) (2.大连理工大学 经济管理学院 系统工程研究所, 辽宁 大连, 116024) 摘要 :本文对辽宁省 2020 年 1 月 22 日至 2 月 20 日期间公开报导的 121 例新型冠状 ...
个人分类: 科研笔记|17657 次阅读|没有评论
基于注意力图卷积网络的联合多事件抽取——“大数据与智能决策”讨论班
郭崇慧 2020-2-13 20:53
事件抽取与ACE2005数据集 事件(Event)是指事情的发生和出现,事件涉及实体(Entity)包括人、对象等,这些实体主动提供了事件或者被动受到事件和世界时空方面的影响。事件抽取在自然语言处理中具有实用价值。在现实世界中,一个句子中存在多个事件是一种普遍现象,同时准确提取多个事件要比提取一个事件困难得多。 ...
个人分类: 科研笔记|4809 次阅读|没有评论
网络表示学习与多网络嵌入——大数据与智能决策讨论班
郭崇慧 2020-2-8 10:11
网络表示学习 网络表示学习(Network Representation Learning,NRL)、网络嵌入(Network Embedding,NE)和图嵌入(Graph Embedding Method,GE)都是同义词,是指网络的向量化表示技术,即用低维、稠密、实值的向量表示网络中的结点,将网络结点映射到K维的向量空间。通过这样一种转化,将复杂的网络信息变成结构 ...
个人分类: 科研笔记|4366 次阅读|没有评论
基于深度神经网络的情感分类——“大数据与智能决策”讨论班
郭崇慧 2020-1-17 11:52
情感分析与情感分类 从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向。因此,情感分析被认为是一个自然语言处理的子任务。 通常可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e, a, s, h, t),其中e表示情感分析的目标实 ...
个人分类: 科研笔记|2926 次阅读|没有评论
基于深度学习的患者再入院风险预测——“大数据与智能决策”讨论班
郭崇慧 2020-1-17 08:25
患者再入院风险预测 现代医学字典把再入院定义为患者在出院后短期内被再次收入住院。然而这个定义缺乏测量意义。在实际研究中,对再入院的期间定义是不统一的,包括3天、7天、1个月(30天或28天)、2个月、4个月或12个月。7天内再入院主要反映住院服务质量(如因过早出院而再入院),8~30天再入院主要反映患者疾病 ...
个人分类: 科研笔记|4281 次阅读|没有评论
城市计算与轨迹数据挖掘——“大数据与智能决策”讨论班
郭崇慧 2020-1-14 10:27
城市计算 城市计算是一个交叉学科,它以城市为背景,是计算机科学、城市规划、交通、能源、环境、社会学、管理学和经济学等多个学科融合的新兴领域。城市计算通过不断获取、整合和分析城市中多源异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)。 图1 城市计算的基本框架 ...
个人分类: 科研笔记|3733 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 08:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部