Riemann7的个人博客分享 http://blog.sciencenet.cn/u/Riemann7

博文

Learning-to-learn项目总结

已有 3318 次阅读 2019-5-2 23:20 |个人分类:科研DEMO|系统分类:科研笔记

        过去的一年,我主要领导和参与了两个项目,分别是语音分离和learning-to-learn。其中语音分离还是原来的老本行声音技术下面的一个小领域,在其他博文已经做了介绍。本篇文章的目的主要是总结一下learning-to-learn项目的经验,以便吃一堑长一智。

        Learning to learn项目主要包含三个子课题,分别是机械臂自动控制、推荐系统、以及小样本学习(few-shot learning)等。这篇文章主要介绍机械臂自动控制和小样本学习。

        对于机械臂自动控制,随着技术的进步,各种设备的智能化程度已经有了很大的提高,在人们生活和工作的各种场景中得到了应用,极大的方便了人们的生活和工作。尽管如此,设备智能化的程度仍然不够高,还需要进一步地提高。让机械臂更加智能、能够快速学会完成各种任务、适应各种环境、实现自主控制的需求变得越来越广泛和迫切,因为这不仅能够极大地降低人力成本,而且能够提高生产效率。

        本子课题提出基于强化学习和元学习相结合的机械臂自主控制方法,使得机械臂能够利用先验知识,更快速地学会完成新的任务。这不仅对于缩短训练时间,提高计算资源的利用率,而且对于最终的性能的提高,都有很大帮助。另外,由于在真实环境中训练机械臂的成本过于高昂,大部分机械臂控制模型的训练都是在仿真环境中进行的,待模型训练完成后再迁移到真实环境中去。但由于真实环境与仿真环境总是存在不可避免的差异,将仿真环境中训练好的模型直接迁移到真实环境,效果往往并不理想。而通过将元学习与强化学习相结合,可以使用少量样本对仿真环境中训练的模型进行微调,从而快速地适应真实环境。

        通过应用本项目所研发的技术,可以极大地提高工业机械臂的自动化程度,譬如快速地转换到执行新的任务、快速地部署到新的产品生产流水线等等,从而为企业节省大量部署成本和时间,进而引领一场新的生产方式的变革。下面是我们的机械臂的演示demo的视频:

image.png

如需完整视频,可以联系我(shiziqiang@cn.fujitsu.com或者shiziqiang7@gmail.com

        关于小样本学习,对于人类来说,仅仅需要少量样本就能学会不同的概念,比如幼儿仅仅需要看过一张或者少量几张猫和狗的照片,就可以对未知的猫狗图片进行分类。而目前的AI系统都需要大量的标注样本数据进行模型的训练,但实际应用中,很多问题是没有大量的标注数据,并且获取标注数据的成本也非常大,例如在医疗领域、安全领域等。

        因此,如何通过举一反三的方式进行小样本学习,成为了一个重要的研究方向。拿分类问题来说,训练集中每个类可能只有一张或者几张样本。它面临的问题是:(1)训练过程中有从未见过的新类,只能借助每类少数几个标注样本;(2)不改变已经训练好的模型。解决少样本学习问题,对于提高数据利用效率,学习泛化知识有着至关重要的作用。

        去年一年通过我们的努力,提出了通过在对抗特征中学习的方法在公开数据集miniImageNet和tieredImageNet上都取得了目前世界最好的性能,其中在miniImageNet上五类仅仅标注1张图片,分类准确率达到63.28%,在tieredImageNet上五类仅仅标注1张图片,分类准确率达到69.54%;如果每类的标注增加到5张标注图片,则分类准确率提高到78.70%和84.35%。相关论文请查看https://arxiv.org/pdf/1903.10225.pdf。

image.png

图1 对抗区域注意力可视化






https://blog.sciencenet.cn/blog-907554-1176769.html

上一篇:语音声音分离软件FurcaNeXt v1.0
下一篇:参加ICASSP2019国际学术会议
收藏 IP: 183.210.69.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 03:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部