機器視覺有望超越人類的極限
ImageNet大型視覺識別挑戰(zhàn)賽,是一項為那些試圖開發(fā)視覺機器人的科學(xué)家舉辦的年度比賽。參賽者必須針對那些具有特定圖像的物體開發(fā)出相應(yīng)的算法,而這個比賽很好的證明了這一趨勢。
到目前為止,無法識別圖像的計算機很難對數(shù)以百萬計的圖像進行解析和提取。但自2012年以來,參加這個挑戰(zhàn)賽的人數(shù)在逐年增加,并且很有可能在近幾年超過我們現(xiàn)有的這一部分。
那么,2012年發(fā)生了什么改變?一個來自加拿大多倫多大學(xué)的團隊提出了一個叫做“監(jiān)督”的算法,可以通過深卷積神經(jīng)網(wǎng)絡(luò)將圖像劃分為1,000個獨立的類。
發(fā)明于1980年代初的深卷積神經(jīng)網(wǎng)絡(luò),由多層排列的人工神經(jīng)元組成,它們反映出了人類大腦處理視覺的方法。隨著摩爾定律推動著計算機技術(shù)越來越強大,這些網(wǎng)絡(luò)能夠更好的模仿神經(jīng)網(wǎng)絡(luò)的實際運作方式。
如今的深卷積神經(jīng)網(wǎng)絡(luò)更加強大。今年ImageNet挑戰(zhàn)賽的贏家是GoogLeNet,來自谷歌的工程師團隊發(fā)明的算法只有6.65%的錯誤率,在相同任務(wù)中已經(jīng)接近人類的錯誤率。
隨著視覺網(wǎng)絡(luò)成為互聯(lián)網(wǎng)越來越重要的一部分,我們正看到圖像學(xué)習(xí)的使用率在增加。Pinterest收購了VisualGraph,這是一家致力于機器視覺的企業(yè),可以將圖片中的衣服和手袋提取并分類。
來自谷歌GoogLeNet項目團隊的工程師ChristianSzegedy,對于機器視覺的技術(shù)應(yīng)用,可能遠遠超過我們?nèi)祟愂褂醚劬Φ姆绞健K麑懙溃?/P>
這些技術(shù)的進步將是我們更好的理解圖像,這些進展也直接的將谷歌的產(chǎn)品,例如照片搜索,圖片搜索,YouTube,汽車自動駕駛,以及任何需要圖像識別的地方。
文章版權(quán)歸西部工控xbgk所有,未經(jīng)許可不得轉(zhuǎn)載。
你可能感興趣的文章