JOS的个人博客分享 http://blog.sciencenet.cn/u/JOS

博文

中国半导体十大研究进展候选推荐(2022-042)——运用时域卷积神经网络的模拟运算语音唤醒

已有 919 次阅读 2022-12-28 09:41 |系统分类:论文交流

image.png


工作简介

         ——运用时域卷积神经网络的模拟运算语音唤醒



近年,语音识别系统的应用越来越普及,但是语音识别系统需要处理庞大的语言模型,它需要大量的运算以及内存的使用,因此会消耗大量的能量。实际上,语音识别系统的使用比例相当低,通常使用语音唤醒来预判输入的信号是否有人声,如果有才会打开语音识别系统。它可以利用少量的计算来大幅降低系统功耗。另一方面,即使语音识别系统是在云端作计算,如果缺少边缘端的语音唤醒,边缘节点还需要把所有原始数据上传送到云端。语音唤醒也能在这种场合减少传输原始数据的功耗。传统的语音唤醒应用滤波器组作语音信号的特征提取,并以神经网络作为分类器。然而由于音频信号的频率很低,因此使用滤波器组作特征提取会有大面积和大功耗的缺点。


为了减少特征提取的功耗和面积,但仍然维持低延时,澳门大学阮家煇助理教授提出把特征提取融入分类器的神经网络里,这一层称作时域卷积神经网络 (TD-CNN)。TD-CNN用被动开关电容电路来作低功耗但是高精度的运算,它所提取出来的特征,只需被量化为1 bit,给后面的二元神经网络作分类,大大降低模数转换的的数量和速度。本工作提出与TD-CNN 配套的稀疏感知计算 (SAC) 与稀疏化量化 (SQ),它们提升了乘加运算的输出信号大小,也让输出差异化,使得电路有更好的抵抗电路失配和噪声的能力。



语音唤醒 (图1) 的输入语音讯号会被分成一个个10 ms长的段落作特征提取,每一个采样的电压会存在模拟内存里,这些输入会分别跟60个卷积核作乘加运算。乘加运算是利用电容的特性q=CV及电荷分享的特性来完成。这些特征会用一个比较器量化为1 bit,这样做会大大降低模数转换的量。后面的二元神经网络会作为分类器。二元神经网络的输出还会被平滑化。



image.png

图1. 语音唤醒系统图。


稀疏感知计算 (SAC) (图2) 是利用wn,1-3把对应零权重的电容开路,减少输出信号的衰减。而且由于电容值是能表达正数的权重,当权重为负数的时候,wn,4会把正负端反接,把权重的负号换到差分输入去。稀疏化量化 (SQ) 会使量化前为常态分布的权重变成双峰分布,并且由于TD-CNN 的只有79个通道,这样会克服中央极限定理,令输出的分布从常态分布变成双峰分布。这会减少因电路失配所造成的比较器阈值飘移导致的量化错误。另外稀疏化量化会令量化后的权重像一个连续分布,提升了模型量化的精度,以排除语音唤醒模型因量化所造成的正确率下降。



image.png


图2. SAC电路以及SQ令输出分布差异化。


本工作在28 nm 的CMOS工艺下进行了流片验证 (图3),由于TD-CNN 使用了开关电容电路来实行高精度、低功耗的特征提取,因此功耗只需108 nW,面积为0.8 mm2,语音唤醒在10 dB 的信噪比下达到92%,比近年的语音唤醒正确率高,且面积小,功耗低。



image.png


图3. 电路实现、芯片照片与语音唤醒正确率比较。



相关成果受澳门大学科研项目和澳门科技发展基金支持。先以题为 “A 108 nW 0.8 mm2 Analog Voice Activity Detector (VAD) Featuring a Time-Domain CNN as a Programmable Feature Extractor and a Sparsity-Aware Computational Scheme in 28 nm CMOS” 发表于International Solid State Circuits Conference 2022,后受邀投稿并被接收至Journal of Solid State Circuits: ISSCC special issue。陈飞飞博士为论文第一作者,阮家煇助理教授为论文通讯作者。



作者简介


image.png


通讯作者

家煇,助理教授,澳门大学微电子研究院助理教授。


2014年在澳门大学获得博士学位,20142015年分别成为澳门大学博士后研究员及讲师。2017-2018年在爱尔兰都柏林大学学院作访问学者。2018年在澳门大学成为助理教授。研究领域包括低功耗模拟运算AI、模拟存内计算、数字及基于FPGAAI加速器等。在ISSCC,JSSC,A-SSCC,T-CAS I等集成电路领域顶级会议和期刊上发表二十余篇论文,受邀于A-SSCC 2021 RiS论坛上发表演讲。



image.png

第一作者

陈飞飞,澳门大学博士。



2011、2018、2022年分别在重庆大学、台湾大学、澳门大学获得学士、硕士、博士学位。2011-2015年任职于深圳芯片设计公司。研究领域为超低功耗人工智能语音处理设计。以第一作者身份在International Solid State Circuits Conference, Journal of Solid State Circuits等会议、期刊发表学术论文。


原文传递



详情请点击论文链接:


https://ieeexplore.ieee.org/document/9834324




https://blog.sciencenet.cn/blog-3406013-1369458.html

上一篇:中国半导体十大研究进展候选推荐(2022-048)——二维滑移铁电中多极化态调控的新策略
下一篇:中国半导体十大研究进展候选推荐(2022-049)——III族氮化物宽禁带半导体的高效p型掺杂新途径研究
收藏 IP: 223.71.16.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-1 16:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部