隨著安防行業(yè)的快速建設(shè)與發(fā)展,目前全國(guó)攝像機(jī)的總量已達(dá)到億級(jí)規(guī)模,每天有海量的視頻資源不斷產(chǎn)生,公安機(jī)關(guān)辦案需要對(duì)大量的視頻錄像進(jìn)行觀(guān)看研判。當(dāng)前視頻圖像建設(shè)應(yīng)用工作是構(gòu )建立體化現(xiàn)代化社會(huì)治安防控體系的重要組成部分,也是深入推進(jìn)“警務(wù)大數(shù)據(jù)”工程的重要抓手。人像識別作為視頻圖像應(yīng)用的新方法新手段,在公安實(shí)戰中具有重要價(jià)值。
回顧過(guò)去十年來(lái)人工智慧的發(fā)展,一切都是有意義的,不過(guò)最好的還沒有到來(lái)。隨著2018年的到來(lái),還會(huì)有很多激動(dòng)人心的進(jìn)展出現(xiàn),特別是在人工智慧視頻監(jiān)控方面。迄今為止,人工智慧的成就一直都是趣味性大於實(shí)用性。不過(guò),時(shí)代在變化,人工智慧除了在醫(yī)療和衛(wèi)生領(lǐng)域取得了重大突破外,在安全行業(yè)也看到了積極的進(jìn)展,尤其是視頻監(jiān)控領(lǐng)域的改善。
人們希望新型的人工智慧監(jiān)視系統(tǒng)能夠實(shí)時(shí)監(jiān)控犯罪行為。例如,Movidius系統(tǒng)可以發(fā)現(xiàn)無(wú)人看管的對(duì)象,實(shí)際應(yīng)用在機(jī)場(chǎng)或火車(chē)站——攝像頭可以識別無(wú)人看管的包,追蹤遺落的時(shí)間並發(fā)出警告,讓現(xiàn)場(chǎng)的安全人員檢查可疑活動(dòng)。
再比如,可以使一個(gè)經(jīng)過(guò)訓(xùn)練的攝像系統(tǒng),用於發(fā)現(xiàn)小偷在行竊前和行竊中的肢體語言和動(dòng)作。當(dāng)這些行為被識破後,安全團(tuán)隊(duì)就可以部署人員對(duì)這一情況進(jìn)行檢查。雖然準(zhǔn)確率高達(dá)90%,但依然無(wú)法進(jìn)行現(xiàn)實(shí)應(yīng)用,這項(xiàng)研究的意義其實(shí)不在於是否能識別罪犯,而是證明了面相和行動(dòng)具有相關(guān)性。其實(shí)有一種方式可以理解,面相和情緒相關(guān),情緒容易激動(dòng)的人面部都有相似的特徵,而情緒容易激動(dòng)的人也可能容易犯錯,比如打人傷人之類(lèi)的。目前並沒有論文顯示,機(jī)器學(xué)習(xí)有沒有把罪犯分類(lèi),是傷害罪還是高智商犯罪。小智君認(rèn)為只有一兩(liǎng)種罪是可能通過(guò)面相看出來(lái)的,比如上面提到的傷害罪,可能由情緒變化引起。其他的犯罪基本不大可能通過(guò)面相表現(xiàn)。同時(shí)行動(dòng)受情緒影響非常大。而每個(gè)人都有自己的情緒波動(dòng)範圍,這個(gè)是內(nèi)在的,而且很有可能通過(guò)面部特徵表現(xiàn)出來(lái)。經(jīng)常激動(dòng)的人臉部就容易形成某些特徵,這跟經(jīng)常鍛鍊的人身體容易形成某些特徵一樣。就像根據(jù)人體的體型肌肉判斷哪些人是健身俱樂部的會(huì)員一樣,是有一定道理的。很多人認(rèn)為基因決定面相,其實(shí)並不全如此,不考慮畸形臉(畸形臉也不在論文的識別範圍),基因只能決定大體框架,人臉的面部脂肪、肌肉甚至骨骼在成長(zhǎng)過(guò)程中都是可以微調(diào)的,而且調(diào)動(dòng)範圍不像想像中那麼小。
上海交大研究裡面提到的“罪犯與常人的的面部特徵的三大不同”,一是罪犯上唇的彎曲程度比非罪犯要大23%,二是罪犯兩(liǎng)隻眼睛內(nèi)角之間的距離比正常人短6%,三是罪犯從鼻尖到嘴角兩(liǎng)條線(xiàn )的角度比非罪犯小20%。其中比較重要的關(guān)注點(diǎn):嘴——嘴唇和嘴角,而嘴算是人類(lèi)面部表情最豐富、脂肪最多的地方之一,完全可以說(shuō)和基因無(wú)關(guān),單靠後天長(zhǎng)期做某些表情就可以改變嘴的脂肪、肌肉分布。而眼睛距離雖然看起來(lái)鍛鍊不出來(lái),不過(guò)差距只有6%,非常小,也是可以通過(guò)長(zhǎng)期的微表情改變的,況且這麼小的差距也不能用來(lái)識別什麼,所以即便理論上已經(jīng)已經(jīng)達(dá)到90%,但用機(jī)器判斷人臉表情這件事,本身就有待商議。
未來(lái)監(jiān)控系統(tǒng)將利用全國(guó)攝像頭以及一些監(jiān)聽設(shè)備採集的視頻和音頻信息進(jìn)行處理和分析,最終提前找出與即將發(fā)生的犯罪行為相關(guān)的人。利用圖像識別,語音識別,語義分析,雲計(jì)算,數(shù)據(jù)挖掘,多信息融合等等。也可以簡(jiǎn)單的概括為:data-driven,即數(shù)據(jù)驅動(dòng)。而其中能真正很快提高識別準(zhǔn)確率的就是“多信息融合技術(shù)”,除了利用臉部特徵信息,還可以利用聲音特徵信息,利用聲音內(nèi)容(比如電話(huà)交談)等信息進(jìn)行融合和判斷。
人工智慧在許多行業(yè)和領(lǐng)域都有很大的潛力,但很難忽視它在安全領(lǐng)域的變革。無(wú)論是用於商店監(jiān)控,還是房主保護(hù)自己的財產(chǎn),或是執(zhí)法查明犯罪行為,其可用之處有更多。