想記錄眼前美景?不用再掏出相機(jī)或手機(jī),只需一句語音指令,佩戴的輕巧時尚的谷歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,只需將手機(jī)攝像頭對準(zhǔn)街道,諾基亞“城市萬花筒”就能將眼前的商店、餐館和景點直接標(biāo)注,覆蓋顯示在手機(jī)圖像上……這些以往多是在電影中看到的畫面,已成為普通人可以觸摸到的現(xiàn)實。機(jī)器視覺——這一“第三只眼”正以巨大的能量,改變著人們的生活和工作方式。
與人眼一決高低
“機(jī)器視覺就是用機(jī)器代替人眼來進(jìn)行識別、測量、判斷等。機(jī)器視覺系統(tǒng)是通過攝像頭將拍攝對象轉(zhuǎn)換成圖像信號,然后再交由圖像分析系統(tǒng)進(jìn)行分析、測量等!敝袊茖W(xué)院自動化研究所模式識別國家重點實驗室研究員黃凱奇博士介紹:“機(jī)器視覺是一項典型的跨學(xué)科任務(wù),涉及到光學(xué)、計算機(jī)視覺、模式識別、機(jī)器學(xué)習(xí)、人工智能、統(tǒng)計學(xué)、認(rèn)知心理學(xué)等等!
機(jī)器視覺最早應(yīng)用于工業(yè)制造領(lǐng)域。通過機(jī)器視覺的自動識別功能,許多流水線上具有高度重復(fù)性的檢測工作都可以不再依靠人來完成,大大提高了檢測效率和精度。黃凱奇介紹,機(jī)器視覺系統(tǒng)最基本的特點就是提高生產(chǎn)的靈活性和自動化程度。在一些不適于人工作業(yè)的危險工作環(huán)境或者人工視覺難以滿足要求的場合,常用機(jī)器視覺來替代人工視覺。同時,在大批量重復(fù)性工業(yè)生產(chǎn)過程中,用機(jī)器視覺檢測方法可以大大提高生產(chǎn)的效率和自動化程度。
機(jī)器視覺技術(shù)在工業(yè)領(lǐng)域的簡單應(yīng)用示意圖
一個典型的機(jī)器視覺系統(tǒng)包括照明、鏡頭、相機(jī)、圖像采集卡和視覺處理器5個部分。由于采集卡能更加迅速地傳輸圖像到存儲器,且計算機(jī)速度不斷加快,所以在目前的機(jī)器視覺系統(tǒng)中,視覺處理器的應(yīng)用逐漸減少。圖像采集卡在機(jī)器視覺系統(tǒng)中舉足輕重。比較典型的PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機(jī)存儲器進(jìn)行處理。有些采集卡有內(nèi)置的多路開關(guān),可連接多臺相機(jī),能控制采集卡采用任意一個相機(jī)捕獲的信息。
伴隨著技術(shù)的發(fā)展,機(jī)器視覺的功能也在不斷擴(kuò)展。黃凱奇說:“缺陷檢測是通過機(jī)器視覺手段來分析零部件信息,從而判斷其是否存在缺陷;測量是通過使用機(jī)器視覺來對考察對象的尺寸、形狀等信息進(jìn)行度量;人機(jī)交互是利用機(jī)器視覺工具分析人或者其他機(jī)器發(fā)出的指令,從而實現(xiàn)對機(jī)器的操縱;環(huán)境建模是對機(jī)器周圍環(huán)境進(jìn)行感知建模,比如移動機(jī)器人對路面環(huán)境進(jìn)行感知建模等!
“目前總的看來,機(jī)器視覺在工業(yè)電子以及半導(dǎo)體行業(yè)應(yīng)用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領(lǐng)域的應(yīng)用如電子眼也較為廣泛,其他行業(yè)如制藥中的藥品成分分析、互聯(lián)網(wǎng)中的視覺計算廣告、物流中的物品分揀等等,都有機(jī)器視覺應(yīng)用的影子!秉S凱奇說。
機(jī)器視覺——這“第三只眼”已在多個領(lǐng)域展現(xiàn)出了比人眼更強(qiáng)大的功能。黃凱奇表示:“機(jī)器視覺利用好了完全可以比人做得更好,因為不同的人在觀看時,信息得不到充分和及時的交流,主觀性也很強(qiáng)。而機(jī)器視覺不僅計算功能強(qiáng)大,而且獲取的信息通過協(xié)同分析后得到的知識會具有‘極高’的價值,尤其在其更趨于智能化之后!
捕獲“深度”世界
在現(xiàn)實生活中,我們越來越需要更多的三維模型來實現(xiàn)對物體或環(huán)境的全面掌握!矮@得三維模型有兩種基本方式,一種是利用激光掃描儀,一種是拍攝照片。但激光掃描儀的成本高,也有可能會對樣本帶來一些損害。第二種方式的成本小,而且在精度上也跟激光掃描儀相差無幾,因此成為了現(xiàn)在研究的一個熱點!敝袊茖W(xué)院自動化研究所模式識別國家重點實驗室副研究員高偉博士一邊展示他們的三維重建照片,一邊介紹。
高偉說,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全面、精確地記錄環(huán)境,可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。高偉所在的機(jī)器人視覺團(tuán)隊研究開發(fā)的中國古代建筑全自動三維重建系統(tǒng),能夠?qū)崿F(xiàn)全自動三維建模,即從底層圖像處理到生成最終的三維模型,全部自動實現(xiàn),無需人工交互。它對圖像的拍攝方式也無特殊約束和限制,只需手持自由拍攝即可。在精度上,也與激光掃描精度相當(dāng),精度小于3cm/100米,通過配備更高像素數(shù)量的相機(jī)和長焦鏡頭還可以實現(xiàn)毫米級重建。
此外,在實時定位與在線三維重建方面,機(jī)器視覺也具有極大的應(yīng)用潛力。高偉介紹了通過機(jī)器視覺在手機(jī)上增強(qiáng)現(xiàn)實的原理,即將手機(jī)上攝像頭讀取的視頻作為輸入,通過初始化、特征點提取、動態(tài)模板特征點匹配、幾何變化計算階段后得到視頻每一幀中感興趣區(qū)域的位置。諾基亞手機(jī)的“城市萬花筒”就是一個應(yīng)用實例。
高偉所在團(tuán)隊在視覺信息處理上的突出創(chuàng)新能力,不斷吸引著國際大企業(yè)前來合作。“我們現(xiàn)在就正與諾基亞公司進(jìn)行合作,共同研究實時定位和在線三維重建。目前,我國基于機(jī)器視覺的三維重建技術(shù)在國際上可以說處于領(lǐng)先地位,應(yīng)用也是比較廣泛的。”高偉說:“除了以上介紹的,還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測方面,像對露天煤礦的監(jiān)測,就是通過無人機(jī)對煤礦進(jìn)行全方位拍攝,生成三維模型來實時監(jiān)測礦山的變化。此外,也能應(yīng)用于城市規(guī)劃、數(shù)字媒體、三維試衣、牙模制造等多方面!
由于單純依靠圖像信息很難實現(xiàn)快速、稠密的三維重建,高偉所在團(tuán)隊也在深入研究將多種傳感器信息相互融合進(jìn)行三維重建的方法。目前,他們已開發(fā)出了利用單目視覺同步定位與地圖創(chuàng)建技術(shù)以及微軟公司的Kinect設(shè)備(微軟公司開發(fā)的應(yīng)用于Xbox360主機(jī)的周邊外設(shè),集成一個彩色攝影機(jī)、一個紅外攝像機(jī)和一個紅外投影機(jī))的全自動場景快速重建系統(tǒng)。這一系統(tǒng)對單幀視頻圖像的處理時間小于50毫秒,可重建出稠密的三維點云,能廣泛應(yīng)用于多種室內(nèi)場景,使用者可以隨意自由拍攝。
互動“大數(shù)據(jù)”時代
聯(lián)系電話:021-31666777
新聞、技術(shù)文章投稿QQ:3267146135 投稿郵箱:syy@gongboshi.com