┊文章閱讀:次
本文講述如何基于城市“五大空間”理論,構(gòu)建技術(shù)體系去感知城市,賦能行業(yè)。同時(shí)會(huì)提及我對(duì)人工智能、云計(jì)算行業(yè)的未來(lái)格局預(yù)測(cè)。
從“五大空間”的感知模式說(shuō)起
城市認(rèn)知需求層面:“五大空間”行為特性,造就異常事件分析平臺(tái)的基礎(chǔ)。
上一篇《“閃馬未來(lái)城”—閃馬的產(chǎn)品戰(zhàn)略及行業(yè)布局》中我們提到了城市的“五大空間”:交通空間,工作學(xué)習(xí)空間,生活?yuàn)蕵?lè)空間,互聯(lián)網(wǎng)信息空間,城市環(huán)境空間。在這些空間中,為人的工作、生活提供安全、高效、干凈的城市環(huán)境是閃馬智能以及與我們志同道合的伙伴們持續(xù)努力的目標(biāo)。
當(dāng)前階段,閃馬智能的首要技術(shù)方向,就是打造最高效地從環(huán)境中感知行為的系統(tǒng)。
從一個(gè)城市級(jí)的感知系統(tǒng)來(lái)說(shuō),它的最外層信息收集能力就是由空間內(nèi)全部的傳感設(shè)施提供的,包括攝像頭和雷達(dá)等。信息收集起來(lái)后,需要神經(jīng)的傳輸,而在傳輸媒介中目前最高效的就是視頻,包含了至少70%以上的有效信息。信息傳輸?shù)慕K點(diǎn)就是中樞神經(jīng),在這里大部分的信息都將獲得自動(dòng)反饋,這就是一座城市的信息中心。深度學(xué)習(xí)技術(shù)的發(fā)展,讓城市中自動(dòng)分析反饋的信息比例不斷提高,解放了反復(fù)機(jī)械化判斷的人力,同時(shí)也催化了計(jì)算機(jī)視覺(jué)的產(chǎn)業(yè)板塊。
雖然我們對(duì)于目前計(jì)算機(jī)視覺(jué)的能力上限已經(jīng)有了一定認(rèn)知,畢竟即使是人力也幾乎不可能識(shí)別類別眾多、復(fù)雜度高、天文數(shù)字級(jí)別數(shù)量的視頻內(nèi)容,何況是機(jī)器。但是計(jì)算機(jī)視覺(jué)目前也已經(jīng)邁過(guò)了最早階段,就是通過(guò)檢測(cè)等方法,對(duì)視頻中的人臉,車輛,物體進(jìn)行識(shí)別,也就是我們最早說(shuō)的視頻結(jié)構(gòu)化應(yīng)用,進(jìn)入了新的技術(shù)周期。
與最早的一批計(jì)算機(jī)視覺(jué)公司相比,閃馬智能的一大特色就是針對(duì)視頻中的行為和事件去判斷視頻的內(nèi)容。從告訴我們「這是誰(shuí)、這是你啊」進(jìn)化到「這個(gè)人在這個(gè)地方干什么」甚至是「這個(gè)人在這里干什么,可能會(huì)造成什么后果?」。這就是事件分析的巨大價(jià)值,它傳達(dá)的不只是信息點(diǎn),而且由時(shí)間串聯(lián)的完整故事。
我們?nèi)绾味x一個(gè)“事件”呢?這就回歸到了我們把城市分成了“五大空間”來(lái)感知的原因。
交通空間:主要感知車輛、人的流動(dòng)時(shí)刻的異常為主。人們會(huì)遵守固定的交通法規(guī)以及相對(duì)固定的道德準(zhǔn)則。法規(guī)以外的違規(guī)就是異常行為,另外還有一些事故,擁堵等現(xiàn)象也是異常的事件。
工作學(xué)習(xí)空間:主要感知個(gè)人行為的異常事件。因?yàn)槿说臄?shù)量通常比較固定,變動(dòng)不大。因此個(gè)體或少部分群體的行為占主導(dǎo),該空間的異常事件也以個(gè)人的行為為主,考慮到工作時(shí)候的效率和安全需求,我們會(huì)有各種各樣工作學(xué)習(xí)時(shí)刻的異常狀態(tài)進(jìn)行監(jiān)管。
生活?yuàn)蕵?lè)區(qū):人流量往往不是很固定,不同時(shí)間段產(chǎn)生不同的大規(guī)模群體行為的異常事件。
互聯(lián)網(wǎng)信息空間:從傳播學(xué)理論來(lái)講,他的異常視頻內(nèi)容屬于一些思想意識(shí)上的不良內(nèi)容檢測(cè),他從數(shù)據(jù)的多樣性到數(shù)據(jù)的不規(guī)則復(fù)雜性都是最高的。
城市環(huán)境空間:環(huán)境的異常檢測(cè)關(guān)注的細(xì)節(jié)業(yè)務(wù)邏輯比較復(fù)雜,覆蓋的空間也更廣,所以行為分析場(chǎng)景更加零散。
“五大空間”異常事件千變?nèi)f化,有頻發(fā)與偶發(fā)、有群體與個(gè)體、甚至還有已知和未知,那么我們?nèi)绾螛?gòu)建視頻異常行為事件平臺(tái)呢?
“五大空間”的分層認(rèn)知能力打造
支撐算法的開發(fā)者:締造算法科學(xué)家樂(lè)園,構(gòu)建的視頻算法開發(fā)閉環(huán)。
我一直有一個(gè)理想,就是構(gòu)建一家“聰明”的企業(yè),讓所有人在這個(gè)企業(yè)快樂(lè)的成長(zhǎng),高效的完成工作的同時(shí),收獲更多的工作樂(lè)趣和成就感。
在Ataraxia AI Lab期間,我們已經(jīng)研發(fā)了好多行業(yè)的視頻模型。不過(guò)我們?cè)诤茉绲臅r(shí)期就發(fā)現(xiàn)一個(gè)問(wèn)題,深度學(xué)習(xí)的主流框架的工程性和易用性太差,導(dǎo)致在編寫算法,訓(xùn)練模型時(shí)候存在很多的機(jī)器資源,系統(tǒng)管理,代碼和手動(dòng)腳本工作,調(diào)試的方法也非常落后,沒(méi)辦法及時(shí)調(diào)試算法的成效。大部分研發(fā)者的時(shí)間都浪費(fèi)在低效且不必要的流程中。
因此我們決定改變這個(gè)情況。
首先,我們需要構(gòu)建一個(gè)平臺(tái),這個(gè)平臺(tái)能夠高效的支持算法的開發(fā)調(diào)試,數(shù)據(jù)的管理,模型的測(cè)試。這里包括了很多的內(nèi)容:計(jì)算存儲(chǔ)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施管理、計(jì)算不同體系結(jié)構(gòu)CPU,GPU支持、計(jì)算資源的管理(容器管理)、存儲(chǔ)和分布式緩存。目前,我們的ATOM平臺(tái)是跨多個(gè)公有云的系統(tǒng),支持在阿里云、七牛云、滴滴云、華為云等多個(gè)云供應(yīng)商上運(yùn)行。
數(shù)據(jù)管理,標(biāo)注系統(tǒng),訓(xùn)練管理和模型管理則是我們用戶層工具鏈也是AI模型開發(fā)的核心效率工具,直接影響整體的效率。我們不斷在工具鏈側(cè)進(jìn)行集成和優(yōu)化,實(shí)現(xiàn)模型迭代的自動(dòng)化,模型調(diào)試的可視化,開發(fā)測(cè)試的系統(tǒng)化。
我覺(jué)得AI的工作首先是快樂(lè)的,所以作為算法科學(xué)家使用的ATOM平臺(tái),不僅應(yīng)是很好的工作和開發(fā)場(chǎng)所,也應(yīng)該是他們學(xué)習(xí)和成長(zhǎng)的樂(lè)園。我們不斷改進(jìn)提升我們“科學(xué)家樂(lè)園”的工具化屬性,讓算法開發(fā)更智能,更有趣。
有了ATOM之后,就開始生產(chǎn)模型引擎,我們搭建三層引擎開發(fā)模式,解決基礎(chǔ)認(rèn)知到行業(yè)Know-How的快速落地:
基礎(chǔ)算法層:首先要有對(duì)空間的基礎(chǔ)元素的檢測(cè)和識(shí)別能力,比如路,人,車等等。
視頻算法層:包括基礎(chǔ)算法之上的視頻跟蹤/集成算法。包括有一些視頻行為分類的模型和算法,比如打架斗毆等等。
邏輯模型層:基礎(chǔ)模型和視頻模型之上,邏輯層往往要結(jié)合行業(yè)Know-How或者“五大空間”的行為特性進(jìn)行開發(fā)。
“通用事件”與“行業(yè)Know-How的專項(xiàng)事件”
三層引擎的開發(fā)結(jié)構(gòu)在很多時(shí)候需要根據(jù)實(shí)際行為和事件的特性進(jìn)行算法架構(gòu)設(shè)計(jì)。
前面提到,在“五大空間”下,因?yàn)樾袨樘匦圆煌?都擁有各自“通用的異常事件”和行業(yè)Know-How專項(xiàng)異常事件。
當(dāng)然不同行業(yè)規(guī)則下就可以設(shè)計(jì)違反規(guī)則的專項(xiàng)異常事件模型,這個(gè)的開發(fā)基于我們對(duì)現(xiàn)有規(guī)則的理解,結(jié)合深度學(xué)習(xí)視頻模型就能開發(fā)行業(yè)Know-How的模型,這個(gè)比較常規(guī),主要是考驗(yàn)復(fù)雜的工程化能力。
但是,很多場(chǎng)景下并不是天然就有定好的規(guī)則,換句話說(shuō),人只有認(rèn)知了規(guī)律,才能制定和更新規(guī)則。那么認(rèn)知規(guī)律如何來(lái)做呢?這里我們要涉及到一個(gè)概念-“正常態(tài)”,所謂“正常態(tài)”就是有一定秩序規(guī)律的模型態(tài),而“正常態(tài)”的反面就是“通用異常事件“的發(fā)生。
前面剛說(shuō)了”五大空間“下的不同運(yùn)行規(guī)律,因此,在不同的空間下,擁有不同的“通用異常事件”發(fā)現(xiàn)引擎,也只有發(fā)現(xiàn)了”通用異?!?才能更好的分類出已有的”行業(yè)異常事件“,或者總結(jié)出新的行業(yè)規(guī)則。
AI工業(yè)化平臺(tái)
賦能行業(yè)應(yīng)用:工業(yè)化賦能平臺(tái),開放的生態(tài)合作
前面講了如何認(rèn)知視頻內(nèi)的異常事件,但是認(rèn)知了事件還不行,我們必須要考慮如何快速的應(yīng)用到各個(gè)行業(yè),通過(guò)異常的發(fā)現(xiàn)賦能行業(yè)。畢竟認(rèn)知的目標(biāo)還是要通過(guò)行業(yè)分工去賦能社會(huì)。
“VisionMind視界心”系統(tǒng)就是我們閃馬全力打造的視頻異常行為分析的工業(yè)化平臺(tái)。他有一下的一些特性:
1.統(tǒng)一的算法工程一體化交付系統(tǒng)
我們把視頻的工程能力,包括任務(wù),接入,消息,統(tǒng)計(jì),運(yùn)維等功能開發(fā)出了一個(gè)計(jì)算操作系統(tǒng),把我們訓(xùn)練出來(lái)的認(rèn)知模型裝載進(jìn)來(lái),賦能到“五線產(chǎn)品”上。
2.完整的數(shù)據(jù)運(yùn)營(yíng)系統(tǒng),通過(guò)和ATOM平臺(tái)的對(duì)接以及數(shù)據(jù)鏈路的打通,完成反饋閉環(huán)和模型的不斷優(yōu)化升級(jí)。
3.面向行業(yè)應(yīng)用的開發(fā)套件
面向行業(yè)我們開發(fā)了可以快速應(yīng)用二次開發(fā)的接口和一些應(yīng)用的庫(kù),像“流實(shí)時(shí)渲染”“預(yù)警墻”“地圖撒點(diǎn)”等等。同時(shí)有豐富的事件API推送。
依托于云平臺(tái)合作,和我們的大數(shù)據(jù)平臺(tái)積累,我們整合了ATOM和VisionMind兩大系統(tǒng)平臺(tái),構(gòu)建了一整套的AI工業(yè)化體系,把算法研究和工程落地一體化,真正實(shí)現(xiàn)快速高效的AI工業(yè)化落地。
利用VisionMind平臺(tái),我們?cè)诮煌?工業(yè),建筑,政府,環(huán)保,互聯(lián)網(wǎng)安全等領(lǐng)域和廣大應(yīng)用開發(fā)者,系統(tǒng)集成伙伴合作高效的賦能行業(yè)。
未來(lái)的技術(shù)生態(tài)
IT行業(yè)從第一代PC時(shí)代,到互聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)之后,開始向物聯(lián)空間進(jìn)發(fā),這是一個(gè)巨大的行業(yè),他會(huì)和最初的信息化系統(tǒng)一樣,賦能各行業(yè)的企業(yè),政府,事業(yè)單位等機(jī)構(gòu)。
然而這里硬件廠商,軟件廠商,運(yùn)營(yíng)商,集成商林立,分別來(lái)自傳統(tǒng)信息化集成和產(chǎn)品,IoT硬件廠商,互聯(lián)網(wǎng)/移動(dòng)互聯(lián)網(wǎng)企業(yè),新興的AI技術(shù)公司,甚至還有原來(lái)工業(yè)自動(dòng)化/電氣公司,傳感領(lǐng)域的設(shè)備/軟件/集成商,可以說(shuō),所有數(shù)字化相關(guān)的企業(yè)全部加入到這個(gè)行業(yè)。目前看來(lái)是一個(gè)混沌狀態(tài),還沒(méi)出現(xiàn)明顯的分工,大家都是在各顯神通的嘗試各個(gè)行業(yè)領(lǐng)域的創(chuàng)新。
那未來(lái)行業(yè)會(huì)怎么樣呢?
我個(gè)人認(rèn)為,大致目前有三層類型公司:
各個(gè)行業(yè)應(yīng)用層:傳統(tǒng)的行業(yè)軟件及集成開發(fā)商在人員規(guī)模和成本上占有優(yōu)勢(shì),依然會(huì)占據(jù)上風(fēng)。
感知能力層:AI軟件/硬件/系統(tǒng)平臺(tái)層面廠家,以及AIoT感知設(shè)備/攝像頭/無(wú)人機(jī)/機(jī)器人廠家等。這一層當(dāng)前不太明朗,會(huì)持續(xù)進(jìn)入行業(yè)分工,兩種趨勢(shì),一種朝上層應(yīng)用走,另外一種往更底層的智能計(jì)算平臺(tái)走。
智能計(jì)算平臺(tái):這里AI技術(shù)公司,云計(jì)算公司,傳統(tǒng)IT硬件轉(zhuǎn)型,芯片公司都在爭(zhēng)取做這個(gè)市場(chǎng),這個(gè)事情體量很大,但是積聚效應(yīng)比較明顯,大廠勝出可能性比較大。
但是隨著AI應(yīng)用的越來(lái)越多,計(jì)算的方式模型越來(lái)越多,會(huì)產(chǎn)生類似我們做的“異常事件平臺(tái)”這樣的系統(tǒng)廠家。我們通過(guò)“五大空間”的認(rèn)知基礎(chǔ),分層構(gòu)建的模型開發(fā)能力,到VisionMind平臺(tái)的“五線產(chǎn)品”,致力于打造新一代視頻行為事件領(lǐng)域的“操作系統(tǒng)”。我們以開放的心態(tài)和上下游展開全方面的合作。
不管您是智能計(jì)算平臺(tái)/芯片/云計(jì)算廠家,攝像頭/無(wú)人機(jī)/機(jī)器人/傳感器等硬件廠商,還是各個(gè)行業(yè)的應(yīng)用開發(fā)/系統(tǒng)集成商,我們都希望和你們共同協(xié)作,賦能城市與行業(yè)。
當(dāng)我們回顧去看一些技術(shù)行業(yè)的發(fā)展史的時(shí)候,我們會(huì)驚奇的發(fā)現(xiàn),所有創(chuàng)新爆發(fā)的節(jié)點(diǎn),都有著驚人的相似背景。
Copyright @ 2013-2020 中國(guó)福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營(yíng)利性網(wǎng)站,部分圖片或文章來(lái)源于互聯(lián)網(wǎng)如果無(wú)意中對(duì)您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請(qǐng)您聯(lián)系,我們立即刪除。