博文

Learning-to-learn项目总结

已有 3318 次阅读 2019-5-2 23:20 |个人分类:科研DEMO|系统分类:科研笔记

过去的一年，我主要领导和参与了两个项目，分别是语音分离和learning-to-learn。其中语音分离还是原来的老本行声音技术下面的一个小领域，在其他博文已经做了介绍。本篇文章的目的主要是总结一下learning-to-learn项目的经验，以便吃一堑长一智。

Learning to learn项目主要包含三个子课题，分别是机械臂自动控制、推荐系统、以及小样本学习（few-shot learning）等。这篇文章主要介绍机械臂自动控制和小样本学习。

对于机械臂自动控制，随着技术的进步，各种设备的智能化程度已经有了很大的提高，在人们生活和工作的各种场景中得到了应用，极大的方便了人们的生活和工作。尽管如此，设备智能化的程度仍然不够高，还需要进一步地提高。让机械臂更加智能、能够快速学会完成各种任务、适应各种环境、实现自主控制的需求变得越来越广泛和迫切，因为这不仅能够极大地降低人力成本，而且能够提高生产效率。

本子课题提出基于强化学习和元学习相结合的机械臂自主控制方法，使得机械臂能够利用先验知识，更快速地学会完成新的任务。这不仅对于缩短训练时间，提高计算资源的利用率，而且对于最终的性能的提高，都有很大帮助。另外，由于在真实环境中训练机械臂的成本过于高昂，大部分机械臂控制模型的训练都是在仿真环境中进行的，待模型训练完成后再迁移到真实环境中去。但由于真实环境与仿真环境总是存在不可避免的差异，将仿真环境中训练好的模型直接迁移到真实环境，效果往往并不理想。而通过将元学习与强化学习相结合，可以使用少量样本对仿真环境中训练的模型进行微调，从而快速地适应真实环境。

通过应用本项目所研发的技术，可以极大地提高工业机械臂的自动化程度，譬如快速地转换到执行新的任务、快速地部署到新的产品生产流水线等等，从而为企业节省大量部署成本和时间，进而引领一场新的生产方式的变革。下面是我们的机械臂的演示demo的视频：

如需完整视频，可以联系我（shiziqiang@cn.fujitsu.com或者shiziqiang7@gmail.com）

关于小样本学习，对于人类来说，仅仅需要少量样本就能学会不同的概念，比如幼儿仅仅需要看过一张或者少量几张猫和狗的照片，就可以对未知的猫狗图片进行分类。而目前的AI系统都需要大量的标注样本数据进行模型的训练，但实际应用中，很多问题是没有大量的标注数据，并且获取标注数据的成本也非常大，例如在医疗领域、安全领域等。

因此，如何通过举一反三的方式进行小样本学习，成为了一个重要的研究方向。拿分类问题来说,训练集中每个类可能只有一张或者几张样本。它面临的问题是:（1）训练过程中有从未见过的新类，只能借助每类少数几个标注样本;（2）不改变已经训练好的模型。解决少样本学习问题，对于提高数据利用效率，学习泛化知识有着至关重要的作用。

去年一年通过我们的努力，提出了通过在对抗特征中学习的方法在公开数据集miniImageNet和tieredImageNet上都取得了目前世界最好的性能，其中在miniImageNet上五类仅仅标注1张图片，分类准确率达到63.28%，在tieredImageNet上五类仅仅标注1张图片，分类准确率达到69.54%；如果每类的标注增加到5张标注图片，则分类准确率提高到78.70%和84.35%。相关论文请查看https://arxiv.org/pdf/1903.10225.pdf。

图1 对抗区域注意力可视化

转载本文请联系原作者获取授权，同时请注明本文来自石自强科学网博客。
链接地址：https://blog.sciencenet.cn/blog-907554-1176769.html

上一篇：语音声音分离软件FurcaNeXt v1.0
下一篇：参加ICASSP2019国际学术会议

收藏 IP: 183.210.69.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

石自强

扫一扫，分享此博文

Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

Learning-to-learn项目总结

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

石自强

全部作者的其他最新博文

全部精选博文导读

相关博文

Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

Learning-to-learn项目总结

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

石自强

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)