什么是計(jì)算機(jī)視覺技術(shù)
計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué),是通過攝像機(jī)或者電腦代替人眼進(jìn)行目標(biāo)檢測(cè)識(shí)別、跟蹤和測(cè)量的技術(shù),具體到智能交通領(lǐng)域就包括車輛檢測(cè),車輛識(shí)別和車輛跟蹤和測(cè)量等。而深度學(xué)習(xí)是一種可用于計(jì)算機(jī)視覺的機(jī)器學(xué)習(xí)技術(shù),它應(yīng)該說是近幾年最火技術(shù)之一。
深度學(xué)習(xí)(DeepLearning)本質(zhì)上講就是一個(gè)多層的深度神經(jīng)網(wǎng)絡(luò),是一種非常接近人腦工作機(jī)制的機(jī)器學(xué)習(xí)算法,為什么叫深度學(xué)習(xí)呢?它是相對(duì)于淺層學(xué)習(xí)而言的,例如含有一個(gè)隱層的神經(jīng)網(wǎng)絡(luò)或者支持向量機(jī)(SVM)算法就是一種淺層學(xué)習(xí)的機(jī)器學(xué)習(xí)算法。
在2012年前,主流的機(jī)器學(xué)習(xí)算法都是淺層學(xué)習(xí)。但在2006年,加拿大的一位執(zhí)著的科學(xué)家Geoffrey Hinton提出了一種多層的神經(jīng)網(wǎng)絡(luò)并創(chuàng)造性的給出了訓(xùn)練的方法,這是一種是模擬人腦工作機(jī)制的機(jī)器學(xué)習(xí)算法,例如一副圖像,人首先看到的是像素,然后是邊緣,然后是結(jié)構(gòu),最后是整體全貌,將圖象分成一層一層的,每一層都比下一層更加抽象,從而可以更好的識(shí)別這個(gè)圖像中的物體,這模擬了人腦的工作機(jī)理。
在2012年之后,在一些國際上大的互聯(lián)網(wǎng)公司大資金投入之后,深度學(xué)習(xí)從最初的理論到實(shí)際應(yīng)用有了非?焖俚陌l(fā)展,就像上面這幅圖,到了2014年的時(shí)候,計(jì)算機(jī)可以僅通過一幅圖片,就可以檢測(cè)和識(shí)別里邊的人、馬、狗等,即使有很大的遮擋,這在2012年之前,其實(shí)是一個(gè)很難的問題,但在2012年之后,借助深度學(xué)習(xí)就很容易就能實(shí)現(xiàn)了。今年深度學(xué)習(xí)應(yīng)用最火的應(yīng)該就是眾人皆知的圍棋機(jī)器人AlphaGo,它以4:1戰(zhàn)神了國際頂尖的圍棋手李世石;跟1996年IBM打造的深藍(lán)機(jī)器人下象棋戰(zhàn)勝人類不一樣,AlphaGo背后的計(jì)算機(jī)程序是只看棋盤,不看邏輯,僅僅通過學(xué)習(xí)大量的棋局來“領(lǐng)悟”圍棋的奧秘從而戰(zhàn)勝人類的,這是一個(gè)劃時(shí)代的進(jìn)步。
在我理解來看,就像這里的2張圖,2012年之前有很多識(shí)別只能叫做“青蛙眼的識(shí)別”,很多目標(biāo)的檢測(cè)是靠運(yùn)動(dòng)信息,靠前背景提取來實(shí)現(xiàn)的,因而只有運(yùn)動(dòng)的東西才能檢測(cè)得到,而不動(dòng)的東西往往檢測(cè)不到,就像青蛙一樣。而如今,計(jì)算機(jī)視覺已經(jīng)進(jìn)入了讀圖時(shí)代,計(jì)算機(jī)的識(shí)圖能力甚至已經(jīng)可以達(dá)到2、3歲小孩的水平了。
計(jì)算機(jī)識(shí)別可以給智能交通帶來什么
我認(rèn)為計(jì)算機(jī)視覺能給交通帶來的主要有如下幾個(gè)方面:第一個(gè)是感知,對(duì)于我們車輛而言就是車輛的檢測(cè),第二個(gè)是車輛身份的識(shí)別,第三是車輛身份的比對(duì),第四個(gè)是車輛的行為分析,第五個(gè)是駕控,也就是現(xiàn)在非;鸬钠囕o助駕駛與無人駕駛。
第一,車輛檢測(cè)與感知
檢測(cè)就是計(jì)算機(jī)通過圖片或者視頻,把其中的車輛或其他關(guān)注目標(biāo)準(zhǔn)確的“框”出來,檢測(cè)是很多系統(tǒng)的基礎(chǔ)。在2012年以前,很多智能交通系統(tǒng)中用的檢測(cè)采用的是一種基于運(yùn)動(dòng)的檢測(cè),這種檢測(cè)會(huì)受天氣、光線等方面的影響,在不同天氣下會(huì)存在很多問題。而基于深度學(xué)習(xí)的檢測(cè),是基于車輛的輪廓和形態(tài)的檢測(cè),是完全模擬人看車的方式,只要人眼可以辨識(shí)那是一輛車,就可以“框”出來,這個(gè)就可以解決很多過去車輛檢測(cè)中存在的問題,排除了天氣光線等來帶的干擾。從檢測(cè)感知角度,我覺得有以下幾個(gè)方面的細(xì)分應(yīng)用。
第一個(gè)是路口的感知
目前的中國很多城市交通擁堵很嚴(yán)重,很多十字路口的紅綠燈配時(shí)其實(shí)并不是最優(yōu)的,通過基于深度學(xué)習(xí)的車輛精確感知檢測(cè),可以精準(zhǔn)的感知交通路口各個(gè)方向的車輛數(shù)量、流量和密度,從而可以給交通路口的最優(yōu)配時(shí)提供準(zhǔn)確依據(jù)。如果各個(gè)路口都用上這種車輛檢測(cè)技術(shù),那對(duì)交通擁堵將是極大的緩解。
這張圖是我們的檢測(cè)結(jié)果,是基于純圖片的檢測(cè)方式,而不是基于運(yùn)動(dòng)的方式,干擾會(huì)大大降低,部分遮擋也不影響車輛檢測(cè),同時(shí)成本也非常低,可以利用現(xiàn)有的已建電子警察、反向卡口或監(jiān)控?cái)z像頭的視頻圖像。
第二個(gè)就是路段的感知
經(jīng)過過去幾年的建設(shè),我國的大中型城市都安裝了很多監(jiān)控?cái)z像頭,通過路段的感知,可以基于原有監(jiān)控系統(tǒng)獲取到道路的總體交通路況,通過這種車輛檢測(cè)技術(shù)就可以為道路路況分析、交通大數(shù)據(jù)、交通規(guī)劃等提供可靠的數(shù)據(jù)依據(jù),這對(duì)于計(jì)算機(jī)在以前要做起來,成本是非常高的,現(xiàn)在就可以采用很低的成本做到,通過圖象快速的感知。
第三個(gè)是路側(cè)停車的感知
有兩個(gè)方面的應(yīng)用,一個(gè)是路側(cè)違法停車的感知和抓拍,不再需要攝像機(jī)去輪詢檢測(cè),大大提高了攝像機(jī)的使用壽命。另外一個(gè)就是路側(cè)停車位的管理,之前的方案在外場(chǎng)要感知車位是否被占用,一般通過地磁感知,成本非常高,系統(tǒng)可靠性也是問題;基于圖象的識(shí)別則可以很好的解決這個(gè)問題,一臺(tái)攝像機(jī)即可監(jiān)控和感知一大片區(qū)域的停車位是否被占用,成本低還所見即所得。就如左邊的圖,基于深度學(xué)習(xí)的檢測(cè),即使這些車輛挨在一起也依然可以準(zhǔn)確檢測(cè),這采用傳統(tǒng)的方法是做不到的。
第四個(gè)是停車場(chǎng)的感知
現(xiàn)在室內(nèi)停車場(chǎng)應(yīng)用圖像識(shí)別實(shí)現(xiàn)車位檢測(cè)的已經(jīng)比較多了,但是現(xiàn)在很多車的檢測(cè)都是基于車牌,有車牌就可以檢測(cè)出來,沒車牌檢測(cè)不出來,甚至有的車牌效果不太好也無法檢測(cè)。而基于深度學(xué)習(xí)的車輛檢測(cè),只看車輛的輪廓,不看車牌,只要看起來像個(gè)車的,就可以檢測(cè)出來。 而且精度很高。右邊的圖,以前是不太可以實(shí)現(xiàn)的,過去室外停車場(chǎng)的數(shù)據(jù)怎么匯集,經(jīng)常是靠停車場(chǎng)的管理員不間斷的報(bào)數(shù)據(jù),這個(gè)成本非常高,而且不可靠。而現(xiàn)在通過計(jì)算機(jī)視覺技術(shù),也同樣可以做到,模擬人的視覺感知,哪個(gè)地方有車停,哪個(gè)地方是空位,直接檢測(cè)出來把數(shù)據(jù)發(fā)送給平臺(tái),發(fā)布到停車場(chǎng)誘導(dǎo)系統(tǒng)上。
第五個(gè)是出入口的車輛感知
現(xiàn)在很多停車場(chǎng)和出入口都上了車牌識(shí)別系統(tǒng),但如果一旦車輛車牌不清楚或車輛沒有掛牌,系統(tǒng)就抓瞎了。而采用基于深度學(xué)習(xí)的車輛特征識(shí)別系統(tǒng),可以識(shí)別車輛本身。 通過車輛的檢測(cè),出入口車輛的檢測(cè)精度可以完全做到99%以上,甚至完全可以替代地磁來進(jìn)行車輛感知,完成抬桿落桿的控制。而基于圖象的車輛檢測(cè),還可以實(shí)現(xiàn)出入口的視頻濃縮存儲(chǔ)等附加功能。
第二,車輛身份特征識(shí)別
計(jì)算機(jī)視覺用于智能交通的第二個(gè)大的應(yīng)用領(lǐng)域就是車輛的身份識(shí)別。今天有專家講ETC和電子標(biāo)簽,通過這兩項(xiàng)技術(shù)來識(shí)別車輛確實(shí)非?煽,而且精度目前來說還是比圖象識(shí)別要高一些。但是現(xiàn)實(shí)中還存在很多現(xiàn)實(shí)問題,比如說現(xiàn)在很多大貨車無法用ETC,還有ETC系統(tǒng)遭到破壞,怎么辦?而電子標(biāo)簽真正落地還有待時(shí)間驗(yàn)證。在這個(gè)時(shí)間窗口,如何實(shí)現(xiàn)車輛身份特征的唯一性識(shí)別?通過深度學(xué)習(xí)提升的車輛識(shí)別不僅僅是車輛的車牌識(shí)別準(zhǔn)確率,還能實(shí)現(xiàn)更多維度的識(shí)別,我們叫車臉識(shí)別,也就是不僅精確識(shí)別車牌,還有車輛的顏色,車輛的類型,車輛的品牌年款,車輛里人物,車輛擋風(fēng)玻璃上的特殊標(biāo)志以及車輛尾部的特征標(biāo)志等。
先說車牌號(hào)碼,車牌識(shí)別已經(jīng)應(yīng)用了很多年,但實(shí)際中還有很多車牌是是很難準(zhǔn)確識(shí)別的,比如隨意大角度傾斜的車牌,在過去很多年其實(shí)解決的都不好,可以說過去3-5年車牌識(shí)別技術(shù)曾處于一種瓶頸期,但現(xiàn)在這兩年可以看到有些已經(jīng)可以識(shí)別了,這其實(shí)很大程度上得益于深度學(xué)習(xí)技術(shù)的應(yīng)用,有了新的突破,各種姿態(tài)的,各種角度的車牌都能很好的識(shí)別。
除了車牌識(shí)別之外,過去很難想象的一個(gè)進(jìn)展就是車輛的品牌年款識(shí)別,我們目前已經(jīng)可以識(shí)別超過3000種的車輛品牌年款了,車頭的檢測(cè)超過95%,車尾的檢測(cè)也超過了90%,車輛顏色超過95%。
除此之外,還可以識(shí)別很多車輛的特有特征,通過深度學(xué)習(xí)技術(shù)可以檢測(cè)你年檢標(biāo)的個(gè)數(shù),也可以識(shí)別你的車有沒有裝行李架,車燈的形狀,有沒有掛件等。
著重提一下就是車輛類型識(shí)別,這個(gè)可以幫助高速公路收費(fèi)。還可以識(shí)別一些特種車輛,如公交車,現(xiàn)在很多省份鼓勵(lì)公交優(yōu)先政策,很多城市在打造公交優(yōu)先快速通行系統(tǒng),如深圳,而目前方案主要是通過裝電子標(biāo)簽來實(shí)現(xiàn)公交車的感知,其實(shí)通過圖像識(shí)別完全可以準(zhǔn)確識(shí)別一輛公交車來了,并優(yōu)先通行。
第三,車輛的比對(duì)
計(jì)算機(jī)視覺用于智能交通的第三個(gè)大的應(yīng)用領(lǐng)域就是車輛的比對(duì),最典型的應(yīng)用就是以圖搜圖,如何在海量圖片里精準(zhǔn)的找到一輛車,所謂世界上沒有兩片相同的樹葉,也沒有兩輛完全一樣的車。大家可以看看這個(gè),右下角的圖,看著以為是一樣的,但是仔細(xì)一看還是有不一樣的,可以區(qū)分出來。
我們研發(fā)的基于視圖大數(shù)據(jù)的以圖搜圖功能,可以在海量圖片里找到一輛特定的車,不管有沒有號(hào)牌,這里還包括一些其他的功能,如套牌車分析等等,套牌車在以前,唯一的方法就是舉報(bào),但現(xiàn)在計(jì)算機(jī)可以通過兩個(gè)車牌是完全一樣的車,通過車型比對(duì)和車輛特征比對(duì)來鑒定是否套牌車。
車輛比對(duì)的另外一個(gè)應(yīng)用場(chǎng)景就是收費(fèi)結(jié)算,目前車牌識(shí)別用在停車場(chǎng)的支付里,還有一些遺留問題,就是還存在無牌車、污牌車和套牌車,因而依然必須依賴人工參與。有沒有一種辦法可以減少或者是不讓人工參與呢?就是通過車臉識(shí)別。通過車臉識(shí)別,可以構(gòu)建車輛多層多維度的特征,相當(dāng)于得到一個(gè)車輛的肖像,然后通過特征比對(duì)去判斷是否同一輛車。 這個(gè)當(dāng)然也可以應(yīng)用在高速公路的逃費(fèi)稽查方面。
此外,目前高速公路上MTC車道受限于技術(shù)等原因,還沒有應(yīng)用移動(dòng)支付,有了這些比對(duì)技術(shù),我認(rèn)為在不久的將來,高速公路的移動(dòng)支付完全可以實(shí)現(xiàn)。
第四,交通視頻的分析應(yīng)用
計(jì)算機(jī)視覺應(yīng)用在智能交通的第四個(gè)大的應(yīng)用領(lǐng)域就是車輛的行為分析。
一個(gè)是交通事故及事件檢測(cè),基于連續(xù)視頻可以分析車輛的行為,檢測(cè)如車輛停車、逆行等行為,發(fā)現(xiàn)交通事故和交通擁堵進(jìn)行報(bào)警,這個(gè)之前在高速公路上應(yīng)用非常廣泛。但由于存在較多的誤報(bào),實(shí)際效果離真正的需求還有一段差距。而借助深度學(xué)習(xí)技術(shù),能實(shí)現(xiàn)真正準(zhǔn)確的交通事件檢測(cè)系統(tǒng),真正的幫交通運(yùn)營部門提供準(zhǔn)確及時(shí)的報(bào)警信息。

第二個(gè)就是車輛違章抓拍,這些近幾年在我國應(yīng)用非常廣泛,而且利用視頻檢測(cè)實(shí)現(xiàn)的非現(xiàn)場(chǎng)執(zhí)法的種類越來越多,現(xiàn)在甚至連開車接打電話都可以識(shí)別抓拍,這些都得益于計(jì)算機(jī)視覺技術(shù)的快速進(jìn)步。
第五,無人駕駛和汽車輔助駕駛
最后要說的一個(gè)應(yīng)用領(lǐng)域就是汽車駕控,就是當(dāng)前非常熱的無人駕駛和汽車輔助駕駛。其中非常重要的一個(gè)技術(shù)點(diǎn)就是圖象識(shí)別,通過圖像識(shí)別前方車輛、行人、障礙物、道路以及交通信號(hào)燈和交通標(biāo)識(shí),這項(xiàng)技術(shù)的落地應(yīng)用將給人類帶來前所未有的出行體驗(yàn),重塑交通體系,并構(gòu)建真正的智能交通時(shí)代。
總結(jié)一下,計(jì)算機(jī)視覺技術(shù)過去5年內(nèi)取得的成績甚至是遠(yuǎn)遠(yuǎn)超過了之前以前的20年,得益于深度學(xué)習(xí)技術(shù)帶來的巨大進(jìn)步,通過計(jì)算機(jī)視覺的廣泛應(yīng)用,能夠大大提升智能交通系統(tǒng)的感知精度與維度,讓智能交通系統(tǒng)更加智慧。
通過深度學(xué)習(xí)技術(shù),未來能夠讓移動(dòng)支付在智能交通系統(tǒng)中更加快速的落地,讓無人駕駛的美好夢(mèng)想變成現(xiàn)實(shí),從而給全人類帶來更加安全、便捷、舒適的出行體驗(yàn)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:機(jī)器視覺在智能交通領(lǐng)域應(yīng)用的五個(gè)方向
本文網(wǎng)址:http://www.oesoe.com/html/consultation/10839320603.html