daxuerushui的个人博客分享 http://blog.sciencenet.cn/u/daxuerushui

博文

语音深度学习分类解析(一)

已有 3728 次阅读 2019-7-17 21:10 |个人分类:DL|系统分类:科研笔记| 语音深度学习

数据来源于kaggle的竞赛,主要目标是将语音信号进行分类,这些信号来源于乐器、人声、动物声、机器声等等。其中的一些标签包括:喇叭声(Trumpet)、尖叫声(Squeak)、喵声(Meow)、掌声(Applause)以及打响指声(finger-snapping)。其中存在的困难是,这些标签并非全部都是人工分类的。一个创造性的解决方案应该是部分的依赖这些弱的标记。



https://blog.sciencenet.cn/blog-3396477-1189989.html

上一篇:声学信号处理基础最佳入门(译):(一)梅尔频率倒谱系数(MFCC)
下一篇:【All about norm】一文理解深度学习中的norm:batch norm、layer norm及其意义
收藏 IP: 180.175.217.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 12:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部