機(jī)器視覺有望超越人類的極限
ImageNet大型視覺識(shí)別挑戰(zhàn)賽,是一項(xiàng)為那些試圖開發(fā)視覺機(jī)器人的科學(xué)家舉辦的年度比賽。參賽者必須針對那些具有特定圖像的物體開發(fā)出相應(yīng)的算法,而這個(gè)比賽很好的證明了這一趨勢。
到目前為止,無法識(shí)別圖像的計(jì)算機(jī)很難對數(shù)以百萬計(jì)的圖像進(jìn)行解析和提取。但自2012年以來,參加這個(gè)挑戰(zhàn)賽的人數(shù)在逐年增加,并且很有可能在近幾年超過我們現(xiàn)有的這一部分。
那么,2012年發(fā)生了什么改變?一個(gè)來自加拿大多倫多大學(xué)的團(tuán)隊(duì)提出了一個(gè)叫做“監(jiān)督”的算法,可以通過深卷積神經(jīng)網(wǎng)絡(luò)將圖像劃分為1,000個(gè)獨(dú)立的類。
發(fā)明于1980年代初的深卷積神經(jīng)網(wǎng)絡(luò),由多層排列的人工神經(jīng)元組成,它們反映出了人類大腦處理視覺的方法。隨著摩爾定律推動(dòng)著計(jì)算機(jī)技術(shù)越來越強(qiáng)大,這些網(wǎng)絡(luò)能夠更好的模仿神經(jīng)網(wǎng)絡(luò)的實(shí)際運(yùn)作方式。
如今的深卷積神經(jīng)網(wǎng)絡(luò)更加強(qiáng)大。今年ImageNet挑戰(zhàn)賽的贏家是GoogLeNet,來自谷歌的工程師團(tuán)隊(duì)發(fā)明的算法只有6.65%的錯(cuò)誤率,在相同任務(wù)中已經(jīng)接近人類的錯(cuò)誤率。
隨著視覺網(wǎng)絡(luò)成為互聯(lián)網(wǎng)越來越重要的一部分,我們正看到圖像學(xué)習(xí)的使用率在增加。Pinterest收購了VisualGraph,這是一家致力于機(jī)器視覺的企業(yè),可以將圖片中的衣服和手袋提取并分類。
來自谷歌GoogLeNet項(xiàng)目團(tuán)隊(duì)的工程師ChristianSzegedy,對于機(jī)器視覺的技術(shù)應(yīng)用,可能遠(yuǎn)遠(yuǎn)超過我們?nèi)祟愂褂醚劬Φ姆绞健K麑懙溃?/P>
這些技術(shù)的進(jìn)步將是我們更好的理解圖像,這些進(jìn)展也直接的將谷歌的產(chǎn)品,例如照片搜索,圖片搜索,YouTube,汽車自動(dòng)駕駛,以及任何需要圖像識(shí)別的地方。
文章版權(quán)歸西部工控xbgk所有,未經(jīng)許可不得轉(zhuǎn)載。
你可能感興趣的文章