6月23日凌晨消息,香港中文大學教授湯曉鷗、王曉剛及其研究團隊上周宣布,他們研發(fā)的DeepID人臉識別技術(shù)的準確率超過99%,比肉眼識別更加精準。
湯曉鷗領(lǐng)導的計算機視覺研究組 (mmlab.ie.cuhk.edu.hk) 開發(fā)了一個名為DeepID (深分證)的深度學習模型, 在LFW (Labeled Faces in the Wild)數(shù)據(jù)庫上獲得了99.15%的識別率。
LFW是人臉識別領(lǐng)域使用最廣泛的測試基準。實驗表明,如果僅僅給出人臉中心區(qū)域,人用肉眼在LFW上的識別率為97.52%。
在此之前,湯曉鷗的研究組開發(fā)了一個基于高斯過程的人臉識別技術(shù)GaussianFace (高斯臉),取得了98.52%的識別率。這也是計算機自動識別算法的識別率首次超過肉眼。
DeepID將GaussianFace的人臉識別世界紀錄又向前推進了一個臺階,首次超過99%的LFW識別率。
人臉識別是計算機視覺和人工智能研究領(lǐng)域一個重要挑戰(zhàn),在公共安全、執(zhí)法、移動互聯(lián)網(wǎng)和娛樂領(lǐng)域都有大量應用。它也成為檢驗人工智能是否可以在解決某些特定智能問題上達到甚至超越人的重要測試基準。
湯曉鷗的研究組在人臉識別領(lǐng)域有十幾年的研究經(jīng)歷。他們從2011年開始開展深度學習方法的研究工作,在2013年達到了92.52%的識別率。過去一年,他們將這一數(shù)字提高到99.15%,
今年早些時候,湯曉鷗和王曉剛的研究組曾發(fā)布了一套基于深度學習的人臉識別算法,在LFW上取得了當時最高的97.45%的識別率. 與此同時,F(xiàn)acebook(64.37, -0.13, -0.20%)發(fā)布了另一套基于深度學習的人臉識別算法DeepFace,在LFW上取得了97.35%的識別率。
DeepFace需要700多萬人臉數(shù)據(jù)作為訓練。而DeepID僅使用了20萬張人臉數(shù)據(jù)以及數(shù)臺Nvidia(18.47, -0.46, -2.43%) K40 GPU。目前,湯曉鷗實驗室的三個人臉識別算法占據(jù)了LFW識別率的前三名,而FaceBook的DeepFace排在第四。
湯曉鷗認為,人臉識別領(lǐng)域還有大量的工作需要做,很多算法需要在實際應用中得到不斷的改進和提高。他的實驗室已經(jīng)基于最新的技術(shù)突破制作出完整的一套人臉圖像處理系統(tǒng)SDK,包括人臉檢測,人臉關(guān)鍵點對準,人臉識別,表情識別,性別識別,年齡估計等各種基礎(chǔ)技術(shù)包。
湯曉鷗計劃把人臉識別技術(shù)免費提供給Android、iOS及Windows Phone開發(fā)者;在這套FreeFace-SDK的幫助下,開發(fā)者能夠在手機上開發(fā)基于人臉識別的各類應用。此外,湯曉鷗還希望利用用戶反饋進一步提高算法的準確率。
除人臉識別外,湯曉鷗和王曉剛的研究組的另一核心研究方向是深度學習。他們設(shè)計了多個深度學習模型,可被用于研究計算機視覺領(lǐng)域的許多重要問題,包括人臉對準、行人檢測、姿態(tài)估計、人體圖像分割、車型識別、大規(guī)模人群監(jiān)控、通用物體識別和檢測、互聯(lián)網(wǎng)圖像檢索等。
深度學習被認為是過去十年中人工智能領(lǐng)域的最大突破,在計算機視覺、語音識別、自然語音處理等領(lǐng)域有許多應用。《麻省理工科技評論》將其列入2013年10項最具突破性技術(shù)。
深度學習試圖模仿人腦如何利用神經(jīng)網(wǎng)絡(luò)來感知世界。它的成果很大程度上受益于近年來出現(xiàn)的大數(shù)據(jù)和基于GPU的并行計算。百度(175.94, 1.44, 0.83%)2013年建立了深度學習研究院;同年12月,F(xiàn)acebook在紐約創(chuàng)建了深度學習人工智能實驗室。2014年,谷歌(556.1, -0.26, -0.05%)4億美金收購深度學習創(chuàng)業(yè)公司DeepMind Technologies。(彥飛)