尽 在 helloear 实 验 室
目前,helloear人耳数据库无论从个体人数和总数据量上均为全球最大规模的人耳数据库,未来有望成为人耳识别领域深度学习算法训练和验证的标准库,为人耳识别深度学习算法走向应用奠定基础。
全球人耳数据库的现状如何,分布于哪里,今天这篇文章将为大家介绍。
人耳数据的起始
通过人类外耳形状来辨别人的可能性在1896年第一次由Alphonse Bertillon实现了,当时Bertillon通过一些测量计算成功辨认出罪犯的身份。从那时起,人们发现每个个体的耳部结构都是特立的并在有生之年保持不变,同时作为外部特征,耳朵又是直观清晰可见的,所以可以极好的作为身份特征而存在。
1949年,时任美国警官的Iannarelli开发创建了人类历史上第一个人耳识别系统。在这一系统里,12种方法被用来测量一张耳部照片,从而确定特征信息,当时全部由人工完成,效率很低且准确率不高。直到1999年,第一个自动人耳识别系统才被Moreno开发完成,当时系统主要基于耳部外形,皱褶和耳穴来分类识别。
2004年,该系统被升级到主要有耳部结构和外形来判断。人耳识别这一关键技术目前的准确率依然有待提高,优化算法并不是最迫在眉睫的问题,而是提供训练算法的数据库本身并不完善。本文简要介绍目前世界范围内普遍应用的人耳数据库,方便大家对此有一初步了解。
这一数据库是在电脑,相机,线性致动器,光源和结构框架的辅助下完成的,包括460组由402个被测人员的视频和另外54名被测人员的多系列图片。每条视频都是由左耳开始,右耳结束,时间在2分钟内。本数据库是不对外公开的。
北京科技大学的数据库是免费开放给相关科研人员的。
图片数据库1:由180副右耳图片组成,拍摄于60名被测人员。三组照片分别是正常裸耳图片,小角度转动后耳部图片以及在不同光照条件下的图片。
图片数据库2:77名被测人员拍摄了4组共计308副照片,分别是在侧视,左右各偏差30°和不同光照条件下完成。
图片数据库3:这一数据库由79名被测人员在不同特定角度完成,图片中包括耳部和面部信息。
图片数据库4:500名被测人员依然在不同角度拍摄耳部和面部特征,角度变化与数据库3相比较大。
这一数据库由155名被测人员各拍摄4组照片完成,还包括了其他照片共计902副。其中12名被测人员拥有半封闭式耳朵,17名女性,6名佩戴耳环。此数据库不对外开放。
圣母大学2014年公开发布此数据库,包括以下4组数据:
数据库F:总共包括464副单耳图片,由114名被测人员在可见光下拍摄完成。
数据库E:942副侧视图,其中包括针对302名被测人员耳部的三维立体和二维平面图。
数据库G:738副侧脸图,其中包括针对235名被测人员侧面的三维立体和二维平面图。
数据库J2:1800副侧脸图,其中包括针对415名被测人员侧面的三维立体和二维平面图。
这一数据库由谢菲尔德大学采集完成,以UMIST这一缩写在相关领域广为人知。数据库中图片由20名被测人员在环绕头部的各个方向共计拍摄564副,2014年对外免费公开。
XM2VTS这一技术目前被广泛应用于人脸识别和人耳识别中,这一数据库由4部纪录片组成,共收录了295名被测人员在每4个月内的4组状况。数据库内的数据均为高清彩色,32KHz 16字节的音频文件,视频系列包括3维模型。
FERET同XM2VTS技术一起,被公认为是目前人脸识别技术中最为成熟的。此数据库由14126副图片组成,包括左侧和右侧面部信息。这些图片可以很好的用作平面耳部识别。此数据库对外开放但要收费。
本期先介绍以上7个人耳数据库,下期我们继续。
文章 李春阳
编辑 zippy
(关于译者:李春阳,留德硕士,主修微电子专业,helloear实验室特约专栏作者)
helloear实验室
研究所有和声音相关的好玩事
友情链接