||
水下识别公开声学数据简介
洪 峰
目前,水下公开的数据集极为少见。本文简要介绍较为流行的ShipsEar数据集(下载链接:https://atlanttic.uvigo.es/underwaternoise/)的基本情况,以供从事水下被动声呐识别分类的同事及研究生参考。这里还简要介绍了数据集录取时的一些要点,这也为拟亲自录取港口数据的同事提供一些经验。
ShipsEar数据集是在2012年秋季和2013年夏季于西班牙西北部的大西洋沿岸进行录音的,具体是在位于Ria de Vigo的比戈港口或其附近(42。14.5’N, 8。43.4’W)录制的。该河谷长35公里,最宽处10公里,最大深度在45 m以下。该港口货物和运输也很繁忙,是最大的鱼港之一。受益于港口交通的高强度和多样性,可以在港口对很多不同类型的船只数据进行录取,包括渔船、远洋客轮、不同大小的渡船、集装箱、滚装船、拖船、领航船、游艇、小帆船等。
水下数据集描述——数据录取方法介绍
录音试验采用的是由MarSensing Lda(Faro,葡萄牙)生产的SR-1数字混合水听器。 该系统包括具有-193.5 dB (re 1V / 1uPa)标称灵敏度的水听器,在1 Hz–28 kHz频率范围具有平坦响应。放大器链由高通截止频率为100 Hz的前置放大器(可将浅水区的环境噪声降至最低)和可编程增益放大器(可在使用前根据需要进行调整)组成。该系统还包括一个24bitA /D sigma-delta转换器,采样率为52734 Hz 数据。WAV格式文件以5 min为持续时间存储于16 GB SD卡上。
(a) | (b) |
图1 录取系统集合配置及数据库快照 |
如图1(a)所示,水听器固定在底部,并连接到水下浮标用于确保垂直度的、水面浮标用于回收。水听器的离底高度根据系泊点的水深选择。在可能的条件下,3个水听器在不同的深度和不同的位置增益用于最大化录取动态范围。在非常浅的区域(深度在10 m以下)可仅用1或2个水听器录取数据。记录日志包括日期和时间、噪声类型、记录点的GPS位置的数据、水听器的近似水平距离、通道深度、水听器增益,还有对感兴趣的船只进行人眼识别的记录时间。录制时也是通过标记视频进行存档。录制时还使用了其他设备——①“水下耳朵”(连接到小型光盘),用于在安装水听器前检测未知噪声源;②由带有远程控制的小喇叭组成的水下声源,用于在摄像机无法录制时与通过的船只进行同步,添加2 kHz的声音作为无法录制事件的标记。
水下数据集描述——数据结构介绍
ShipsEar数据集包含了实测的真实船只的声音。人为的和自然的背景噪声都是存在的,也偶尔包括了哺乳动物发出的声音。每次录音时,水听器的位置设计时考虑尽可能提高获取感兴趣船只的声音质量、并试图将其他船只产生的噪声降至最低,因为录音时总是不可避免地存在通过这个高流量区域的船只。ShipsEar充满了由部署在码头处的水听器获取的不同速度船只噪声,以及进入或驶离码头时运动时的空化噪声。同样,还可以经常听到波浪撞击港口基础设施时的较高的背景噪声。
ShipsEar还包含了正常行驶条件下的船只的声音数据。选定的是3个录音地点位于Ria de Vigo的中部(靠近通往Vigo港口进口和其他附近的港口)。利用一艘辅助船来安装水听器,并且根据由港口管理部门与船舶自动识别系统(AIS)获取的船只运动信息来安排录音。其他船只的声音则是偶然性地记录。数据集也包括了在拉科鲁尼亚(LaCoruña)外港吸泥机的声音。除此以外,数据集还包括了由自然现象产生的背景噪声,而这种记录对于训练船只分类器是有用的。在恶劣天气的几天中,设备已安装在远郊的Intecmar气象站(www.intecmar.org)。该数据库包含了风、雨、浪和水流4种噪声记录,用于后续表征这些天然来源的背景噪音。
考虑到每个声压的不确定性,故尽可能部署几个不同增益的水听器。在这种情况下,只将声压最高的声音裁剪后归入数据库中。录音分割时留了较大的余量,以便完整保留事件起止信息。背景噪声过大的录音或具有误导性、含糊性的船只噪声数据均去除。最终数据库包括90条wav格式的记录,持续时间为15 s至10 min。 每个音频文件及其对应的数据形式在ShipsEar数据库中形成一条记录,其信息字段如下表所示:
“id” | 每条记录的数字标识符。 |
‘name’ | 记录的名称,通常是船只的名称(除了未知船只或自然背景噪音) |
‘type’ | 船只类别/背景噪音,可能值:渔船fishing boat,拖网渔船trawler,贻贝船mussel boat,领航船pilot ship,拖船tugboat,挖泥船dredger,滚装船ro-ro,远洋客轮ocean liner,客轮passenger ferry,帆船sailboat,摩托艇motorboat和背景噪音background noise(风wind,雨rain,浪waves和流current)。 |
‘pic’ | 船只图片的链接。 |
‘location’ | 谷歌地图上记录的设备的GPS位置。 |
‘date’ | 录制时间和日期,格式为YYYY–MM–DD HH:MM:SS格式。如果没有确切的信息,则记录时间是00:00:00。 |
“ H_G_D” | 水听器的增益和深度,由水听器的数量(最多3个),水听器增益 和水听器深度,以到海平面的距离来衡量。例如H_G_D =(1,2)(16,32)(5,7.5)表示使用水听器1和2进行录音,增益分别是16和32,以及与海底的距离分别为5 m和7.5 m。 |
‘audio’ | 音频文件链接和用于收听录音的流播放器。 |
‘video’ | 是否存在录制文件。 |
‘channeldepth’ | 水听器位置处的海水高度c(m)。 |
‘wind’ | 原位测量的风速(km/h)。 |
‘ais link’ | 到船只AIS的链接(如果有)。 |
‘distance’ | 船只与水听器的垂直方向近似距离(d)。若未知,则以区间记录:<50 m,50–100 m,100–150 m, > 150 m。 |
‘atmospheric and oceanographic data’ | 大气和海洋数据:从附近气象站获得的温度、湿度,风速和降雨数据。
|
‘duration’ | 录音的持续时间。 |
‘notes’ | 在录制过程中或从视频文件获取的其他备注。 |
图1(b)则显示了ShipsEar数据库在线界面的快照。它是使用PHP / MySQL构建的,其数据是以表格形式展示,每行代表一条记录。字段名称位于每一列的开头。
ShipsEar这一数据库可为研究人员提供包含了各种船只和不同背景噪声的水下海洋声音。其应用场景之一是进行船只识别以用于监视海上交通。此外,文章还介绍了用于录取数据及获取其他信息的方法,以便人们可以使用此数据库以及将来扩张此数据。
目前来讲,对于四种类型的目标分类应用,利用基于倒谱系数和GMM方法实现的总体分类精度可达75%,这个可作为研究人员后续研究的基线精度。在分类研究方面,显然还有很大的提升空间。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 12:37
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社