博文

语音深度学习分类解析（一）

已有 3728 次阅读 2019-7-17 21:10 |个人分类:DL|系统分类:科研笔记| 语音深度学习

数据来源于kaggle的竞赛，主要目标是将语音信号进行分类，这些信号来源于乐器、人声、动物声、机器声等等。其中的一些标签包括：喇叭声（Trumpet）、尖叫声（Squeak）、喵声（Meow）、掌声（Applause）以及打响指声（finger-snapping）。其中存在的困难是，这些标签并非全部都是人工分类的。一个创造性的解决方案应该是部分的依赖这些弱的标记。

转载本文请联系原作者获取授权，同时请注明本文来自洪峰科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3396477-1189989.html

上一篇：声学信号处理基础最佳入门（译）：（一）梅尔频率倒谱系数(MFCC)
下一篇：【All about norm】一文理解深度学习中的norm：batch norm、layer norm及其意义

收藏 IP: 180.175.217.*| 热度|

当前推荐数：1 推荐人：杨正瓴

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

洪峰

扫一扫，分享此博文

daxuerushui的个人博客分享 http://blog.sciencenet.cn/u/daxuerushui

博文

语音深度学习分类解析（一）

当前推荐数：1 推荐人：杨正瓴

该博文允许注册用户评论请点击登录评论 (0 个评论)

洪峰

全部作者的其他最新博文

全部精选博文导读

相关博文

daxuerushui的个人博客分享 http://blog.sciencenet.cn/u/daxuerushui

博文

语音深度学习分类解析（一）

当前推荐数：1 推荐人： 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

洪峰

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：1 推荐人：杨正瓴

该博文允许注册用户评论请点击登录评论 (0 个评论)