2016 年 6 月,微软向公众发布了大规模现实世界面部图像数据集 MS-Celeb-1M,含有 10 万个名人的约 1000 万(10M)张脸部图片,鼓励研究人员开发先进的人脸识别技术。
同时宣布的还有 MS-Celeb-1M 百万人脸识别挑战赛。参赛者需要根据(但不限于)挑战赛提供的数据集作为训练数据,开发图像识别系统,从脸部图像中识别 100 万个名人。
今天,竞赛结果公布,其中:
百万名人识别子命题,
a,无限制类(可以自由使用外部数据),Panasonic-NUS(新加坡国立大学)获得第一名,中科院重庆绿色智能技术研究院(CIGIT)与中科院合作团队第二,美国东北大学第三;
b,有限制类(只使用竞赛提供数据),第一名是 Beijing Orion Star Technology Co., Ltd.
识别单一训练样本的名人子命题,
a,无限制类(可以自由使用外部数据),第一名是 NUS-Panasonic
b,有限制类(只使用竞赛提供数据),第一名是美国东北大学
优胜团队在技术上都采用了基于深度学习的方法,以及网络大数据。从中可以看出,网络大数据是发展趋势,多模型融合是现在各个比赛得奖的利器。
微软百万名人识别竞赛 MS-Celeb-1M:填补学术界与工业界的空白
人脸识别竞赛有很多,微软的百万名人识别挑战赛与已有的竞赛有什么不同?
据微软技术与研究院(Microsoft Technology and Research)首席研究员/研究经理张磊博士介绍:首先,MS-Celeb-1M 的目标是识别百万人脸,是计算机视觉内最大规模的分类问题,并且其中一个人物对应一个 entity,绑定了知识库,并且知识库中提供了每个人的职业,性别等等丰富的信息,从而解决了人物重名的问题,可以从识别达到认知。“最开始我们是面向学术界做的这个数据集,”张磊告诉新智元:“但后来很多工业界的同行也表示我们的数据集对他们的研究工作很有帮助。”
深度学习算法的进步使视觉识别在过去几年中取得了很大的进步。但是,学术上的创新和实际投入生活使用的智能服务间仍然存在巨大差距,主要因为:
(1)学术研究缺乏现实世界的大规模数据,从而阻碍了有效训练和评估算法;
(2)缺乏公开透明的平台进行公正、高效的评估,使识别结果可复现,容易获得。
目前,几个主要的人脸识别数据集,公开获取的(下图绿色)有:
LFW 是美国马萨诸塞大学的一个数据集,规模在万这个级别(13k);
YFD 是耶鲁人脸数据集,由耶鲁大学计算视觉与控制中心创建,有不同的光照、表情和姿态的变化,但数量较少;
CelebFace 含有 20 多万张图片;
CASIA WebFace 是中科院自动化研究所的几种数据集,里面包含掌纹、手写体、人体动作等 6 种数据集;需要按照说明申请,免费使用。
接下来,Facebook 和谷歌的数据集规模虽大,但都无法公开获取。
这些无不体现了存在于学术界和产业界之间的一道明显的鸿沟。
因此,微软技术与研究院的郭彦东博士等人才在 2016 年提出了 MS-Celeb-1M 基准测试。MS-Celeb-1M 虽然也是名人脸部数据,但使用从网络上搜集的一个名人所有可能收集到的脸部图像作为训练数据。基于知识库的丰富信息有助于消除歧义,并提供丰富的人物信息,提高识别准确性,从而贴近于各种现实应用,比如图像字幕和新闻视频分析、舆情分析等等。