leileiya的个人博客分享 http://blog.sciencenet.cn/u/leileiya

博文

非结构化大数据处理技术及应用

已有 7155 次阅读 2013-4-25 23:37 |个人分类:讲座心得|系统分类:科研笔记| 大数据, 非结构化

   今天(4月25日)在南京大学听取了北京拓尔思信息技术股份有限公司总裁施水才教授有关非结构化大数据处理技术及应用的讲座。

   大数据是新一代信息技术的研究和应用热点,各种实时数据、非结构化数据、机器数据的爆炸式增长,大数据时代已经来临。对大数据进行深度的分析和挖掘,可以帮助一个组织更好的调用内部、外部以及公共信息进行前瞻性的数据判断。在对大数据的处理中,非结构化是面临的最大挑战,80%的数据都是非结构化的。施水才教授提到了语义智能计算、自动分类、关键词标引与自动摘要技术、命名实体识别、实体关系的抽取、自动过滤与自动消重、话题检测与追踪技术、情感分析、多媒体标注和检索、以及深度学习都是处理大数据必备的技术手段。

   拓尔思是国内A股市场唯一以非结构化大数据处理为核心的上市企业。旗下的产品有TRS Hybases海贝大数据管理平台、TRS 机器数据挖掘引擎、基于多引擎的弹性大数据管理系统、海量异构数据的采集系统、基于Hadoop的大数据分析系统等一系列基于大数据的实用系统,已经得到很好的应用效果。




https://blog.sciencenet.cn/blog-918667-684031.html

上一篇:Lexxe语义检索
下一篇:用计量的方法研究语言

3 章成志 李伟钢 罗春元

该博文允许注册用户评论 请点击登录 评论 (8 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-7-2 23:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部