一片小小的人工智慧視覺晶片能做什麼?無(wú)人駕駛汽車(chē)主動(dòng)識別並避讓行人、攝像頭實(shí)時(shí)甄別在逃犯……這些影視作品中的情節(jié),或許不久將可通過(guò)基於嵌入式人工智慧視覺晶片的“解決方案”成為現(xiàn)實(shí)。
人工智慧晶片被視為未來(lái)人工智慧時(shí)代的戰略制高點(diǎn)。在視覺感知領(lǐng)域,人工智慧視覺晶片正逐步應(yīng)用於智慧型手機(jī)、安防監(jiān)控、自動(dòng)駕駛、醫(yī)療成像和智能製造等領(lǐng)域。
可根據(jù)AI需求成像
縱觀(guān)信息產(chǎn)業(yè)發(fā)展歷程,從個(gè)人電腦時(shí)代到移動(dòng)網(wǎng)際網(wǎng)路時(shí)代,承載高性能計(jì)算的晶片決定新型計(jì)算平臺(tái)的基礎(chǔ)架構(gòu )和發(fā)展生態(tài),並掌握著產(chǎn)業(yè)鏈最核心的話(huà)語權(quán)。
中國(guó)科學(xué)院院士張鈸指出,傳統(tǒng)硬體架構(gòu )難以滿(mǎn)足人工智慧時(shí)代深度學(xué)習(xí)的要求,新的算法需要新的硬體來(lái)支撐。同時(shí),晶片的結(jié)構(gòu )將越來(lái)越像“大腦”,類(lèi)腦晶片、智能晶片等將是人工智慧的發(fā)展方向。
“所謂視覺晶片,實(shí)際上是一種具有高速圖像採集和實(shí)時(shí)圖像處理功能的片上集成系統(tǒng)晶片。”中國(guó)科學(xué)院半導(dǎo )體研究所半導(dǎo )體超晶格國(guó)家重點(diǎn)實(shí)驗(yàn)室研究員吳南健介紹說(shuō),在日前舉辦的國(guó)家自然科學(xué)基金優(yōu)秀成果北京對(duì)接會(huì)上,吳南健帶領(lǐng)研究團(tuán)隊(duì)展示的新型視覺晶片(VisionChip)科研成果很是引人注目。
據(jù)介紹,這種視覺晶片集成高速圖像傳感器和大規(guī)模並行圖像處理電路,能夠模仿人類(lèi)視覺系統(tǒng)視覺信息並行處理機(jī)制,解決現(xiàn)有視覺圖像系統(tǒng)中數(shù)據(jù)串行傳輸(shū)和串行處理的速度限制瓶頸問(wèn)題。
吳南健解釋說(shuō),人工視覺的架構(gòu )分兩(liǎng)部分,類(lèi)似於人的眼睛和大腦。人的眼睛是一個(gè)典型的圖像傳感器,能夠攝取圖像並且進(jìn)行一些噪音去除等初級(jí)圖像處理;人的大腦神經(jīng)元網(wǎng)絡(luò)是一個(gè)視覺圖像處理系統(tǒng),具有非常強(qiáng)的對(duì)所攝取的視覺信息進(jìn)行並行處理的能力。
AI視覺晶片與攝像頭的關(guān)係是——晶片做的是大腦,攝像頭做的是眼睛。這裡就存在一個(gè)問(wèn)題:大腦該如何控制眼睛?遠(yuǎn)望智庫(kù)人工智慧事業(yè)部部長(zhǎng)、圖靈機(jī)器人首席戰略官譚茗洲解釋道,傳統(tǒng)的技術(shù)方法是定義一個(gè)通信控制接口,但在視覺應(yīng)用中這種做法會(huì)非常複雜。人眼的成像是非常聚焦的,只看到關(guān)注的東西。當(dāng)AI算法解決了“要看什麼”的問(wèn)題後,前端成像就有了目標(biāo),可以把所有的資源都調(diào)配到關(guān)注的對(duì)象上,做到“指哪打哪”,也就是取出噪音的處理過(guò)程,可以更高效智能地處理視覺信息。這種根據(jù)AI的需求來(lái)成像,能解決很多以前解決不了的問(wèn)題。
“通常以前處理的方式,是通過(guò)攝像頭把信息攝錄,傳到伺服器或雲端後,利用伺服器上的顯卡進(jìn)行運(yùn)算,現(xiàn)在是將視覺晶片嵌入攝像頭,讓其本身可以處理信息,做成專(zhuān)用晶片,如果晶片大批量生產(chǎn),在價(jià)格上會(huì)便宜非常多,極大降低成本。這就是目前這項(xiàng)技術(shù)突破的核心價(jià)值。”譚茗洲在接受科技日報(bào)記者採訪(fǎng)時(shí)指出。
比人類(lèi)視覺更具優(yōu)勢(shì)
在我們通常的印象中,一個(gè)視力正常的人可以迅速且毫不費(fèi)力地感知世界,甚至可以詳細(xì)生動(dòng)地感知整個(gè)視覺場(chǎng)景;但其實(shí)這只是一個(gè)錯覺。
“人類(lèi)生理視覺有著天然的局限,只有投射到眼球中心視覺場(chǎng)景的中間部分,我們才能看清楚。比起人眼來(lái),嵌入視覺晶片的機(jī)器將具備相當(dāng)多的優(yōu)勢(shì),因為可以傳感更寬的頻譜範圍、更高的清晰度、更寬的視角,其視力遠(yuǎn)不止5.0,在夜間也可以看得很清楚。如同AlphaGo戰勝‘圍棋天才’一樣,在某些應(yīng)用場(chǎng)景,其視覺在準(zhǔn)確性、客觀(guān)性、穩(wěn)定性等方面都要比人類(lèi)視覺更具優(yōu)勢(shì)。”譚茗洲指出。
吳南健介紹說(shuō),目前,國(guó)內(nèi)外在人工視覺晶片領(lǐng)域的研究主要是CMOS圖像傳感器晶片技術(shù)、並行圖像處理技術(shù)和CMOS集成技術(shù)。在CMOS圖像傳感器領(lǐng)域,國(guó)際技術(shù)水平朝著高解析度、寬動(dòng)態(tài)範圍、高幀率、高智能化、寬波長(zhǎng)範圍和三維成像的方向發(fā)展。人工視覺系統(tǒng)晶片能夠完成圖像獲取和初級(jí)(圖像濾波)、中級(jí)(特徵提取)、高級(jí)(特徵識別和不規(guī)則處理)3個(gè)圖像處理步驟。
“視覺晶片關(guān)鍵要解決運(yùn)行效率和處理3D影像這兩(liǎng)個(gè)問(wèn)題。以往視覺晶片處理信號(hào)面臨的最大問(wèn)題是因運(yùn)算量太大導(dǎo )致處理信息速度低,以及攝取的照片是把三維世界‘壓縮’成二維影像,在一張平面上已分不清物體距離遠(yuǎn)近、立體空間形狀、空間位置等,而人眼可把這個(gè)還原。”譚茗洲表示。
記者了解到,新型人工智慧視覺系統(tǒng)晶片,是將高速CMOS圖像傳感器、並行信號(hào)處理單元和輸(shū)出電路集成於單一晶片內(nèi),實(shí)現(xiàn)實(shí)時(shí)視覺晶片系統(tǒng)。將不同功能的技術(shù)集成在一個(gè)晶片上有很多優(yōu)勢(shì),實(shí)現(xiàn)圖像獲取和圖像信息處理每秒一千幀的系統(tǒng)速度,可廣(guǎng)泛應(yīng)用於高速圖像處理、快速圖像識別解釋、高速運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)追蹤等領(lǐng)域。
譚茗洲指出:“目前,中科院設(shè)計(jì)的新型視覺系統(tǒng)晶片理念非常先進(jìn),仿照人類(lèi)視網(wǎng)膜神經(jīng)元機(jī)制設(shè)計(jì),感光對(duì)信號(hào)的處理方式,揀取有用的信號(hào)進(jìn)行處理,極大地減少了運(yùn)算的體量。”
未來(lái)市場(chǎng)空間巨大
“以我個(gè)人的觀(guān)點(diǎn),視覺系統(tǒng)晶片會(huì)成為必然的趨勢(shì),就像手機(jī)和相機(jī)結(jié)合成就智慧型手機(jī)一樣,目前在技術(shù)上已突破填充率低、解析度低和信號(hào)幹擾嚴(yán)重的難題,將科研成果轉(zhuǎn)化並投放市場(chǎng)只不過(guò)是時(shí)間問(wèn)題。”吳南健表示。
記者了解到,目前基於該技術(shù)的產(chǎn)成品已經(jīng)試用於一些創(chuàng)新企業(yè),比如在工業(yè)產(chǎn)品的自動(dòng)化檢測(cè)領(lǐng)域完全可以使用視覺系統(tǒng)晶片代替人工檢測(cè);在智能監(jiān)控領(lǐng)域,過(guò)去需要將視覺處理晶片裝在具有傳感器技術(shù)的攝像頭上,通過(guò)把數(shù)據(jù)結(jié)構(gòu )化、再壓縮送到數(shù)據(jù)中心的複雜方式完成數(shù)據(jù)傳輸(shū)和計(jì)算。
那麼,視覺系統(tǒng)晶片如果在未來(lái)實(shí)現(xiàn)產(chǎn)業(yè)化,其市場(chǎng)空間有多大?據(jù)推算,2018年,圖像傳感器的市場(chǎng)規(guī)模在150億美元左右,雖然其中120億美元發(fā)生在智慧型手機(jī)領(lǐng)域,但未來(lái)發(fā)展比較快的4個(gè)領(lǐng)域是安防、國(guó)防、汽車(chē)、醫(yī)療,到2021年將會(huì)迎來(lái)40億美元的市場(chǎng)空間,年增長(zhǎng)率約10%—20%。
“視覺處理器的需求增長(zhǎng)會(huì)更快,目前該市場(chǎng)的整體規(guī)模(包括硬體、軟體、服務(wù))在170億美元至180億美元,單從硬體來(lái)看也佔到約30億美元。如果視覺系統(tǒng)晶片可以覆蓋70億美元的市場(chǎng)規(guī)模,企業(yè)在這中間拿到1%的話(huà),其盈利空間就已經(jīng)很大了。”吳南健指出。
近年來(lái),國(guó)內(nèi)外一批新型人工智慧企業(yè),依託人工智慧領(lǐng)域技術(shù)和算法優(yōu)勢(shì)向晶片行業(yè)滲透,加強(qiáng)人工智慧晶片基礎(chǔ)層研發(fā)。從市場(chǎng)格局來(lái)看,已經(jīng)發(fā)展成為一個(gè)相對(duì)獨(dú)立又相互依存的產(chǎn)業(yè)生態(tài)。在前端,索尼是圖像傳感器市場(chǎng)、生產(chǎn)和技術(shù)的領(lǐng)導(dǎo )者,緊隨其後的三星和豪威科技也保持著不錯的競(jìng)爭(zhēng)力;在後端,Mobileye和英偉達(dá)(NVIDIA)是提供視覺處理晶片的主要廠(chǎng)商,在國(guó)內(nèi)該領(lǐng)域的公司有地平線(xiàn )等。
然而,截至目前,尚未有企業(yè)實(shí)現(xiàn)“圖像傳感器+視覺處理器”集成式晶片的大規(guī)模量產(chǎn)。不管是現(xiàn)在的創(chuàng)業(yè)企業(yè),還是已經(jīng)在市場(chǎng)上佔有一定份額的大企業(yè),不是做圖像傳感器,就是做後端的視覺處理器。正如吳南健所言,這將給初創(chuàng)企業(yè)帶來(lái)機(jī)會(huì)。
【來(lái)源:科技日報(bào)】