機(jī)器視覺有望超越人類的極限

分類：行業(yè)資訊日期：2014-10-22 16:46:43 來源：網(wǎng)絡(luò)轉(zhuǎn)載

　　ImageNet大型視覺識(shí)別挑戰(zhàn)賽，是一項(xiàng)為那些試圖開發(fā)視覺機(jī)器人的科學(xué)家舉辦的年度比賽。參賽者必須針對那些具有特定圖像的物體開發(fā)出相應(yīng)的算法，而這個(gè)比賽很好的證明了這一趨勢。

　　到目前為止，無法識(shí)別圖像的計(jì)算機(jī)很難對數(shù)以百萬計(jì)的圖像進(jìn)行解析和提取。但自2012年以來，參加這個(gè)挑戰(zhàn)賽的人數(shù)在逐年增加，并且很有可能在近幾年超過我們現(xiàn)有的這一部分。

　　那么，2012年發(fā)生了什么改變?一個(gè)來自加拿大多倫多大學(xué)的團(tuán)隊(duì)提出了一個(gè)叫做“監(jiān)督”的算法，可以通過深卷積神經(jīng)網(wǎng)絡(luò)將圖像劃分為1,000個(gè)獨(dú)立的類。

　　發(fā)明于1980年代初的深卷積神經(jīng)網(wǎng)絡(luò)，由多層排列的人工神經(jīng)元組成，它們反映出了人類大腦處理視覺的方法。隨著摩爾定律推動(dòng)著計(jì)算機(jī)技術(shù)越來越強(qiáng)大，這些網(wǎng)絡(luò)能夠更好的模仿神經(jīng)網(wǎng)絡(luò)的實(shí)際運(yùn)作方式。

　　如今的深卷積神經(jīng)網(wǎng)絡(luò)更加強(qiáng)大。今年ImageNet挑戰(zhàn)賽的贏家是GoogLeNet，來自谷歌的工程師團(tuán)隊(duì)發(fā)明的算法只有6.65%的錯(cuò)誤率，在相同任務(wù)中已經(jīng)接近人類的錯(cuò)誤率。

　　隨著視覺網(wǎng)絡(luò)成為互聯(lián)網(wǎng)越來越重要的一部分，我們正看到圖像學(xué)習(xí)的使用率在增加。Pinterest收購了VisualGraph，這是一家致力于機(jī)器視覺的企業(yè)，可以將圖片中的衣服和手袋提取并分類。

　　來自谷歌GoogLeNet項(xiàng)目團(tuán)隊(duì)的工程師ChristianSzegedy，對于機(jī)器視覺的技術(shù)應(yīng)用，可能遠(yuǎn)遠(yuǎn)超過我們?nèi)祟愂褂醚劬Φ姆绞健Ｋ麑懙溃?/P>

　　這些技術(shù)的進(jìn)步將是我們更好的理解圖像，這些進(jìn)展也直接的將谷歌的產(chǎn)品，例如照片搜索，圖片搜索，YouTube，汽車自動(dòng)駕駛，以及任何需要圖像識(shí)別的地方。

文章版權(quán)歸西部工控xbgk所有，未經(jīng)許可不得轉(zhuǎn)載。

機(jī)器視覺