中國(guó)福建網(wǎng)

當(dāng)前位置:中國(guó)福建網(wǎng) > 數(shù)碼 > 正文

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

作者: 編輯 來(lái)源:互聯(lián)網(wǎng) 發(fā)布時(shí)間:2018-11-13

┊文章閱讀:

11月8日,獵豹移動(dòng)董事長(zhǎng)兼 CEO 傅盛出席第五屆世界互聯(lián)網(wǎng)大會(huì)“物聯(lián)網(wǎng):連接無(wú)處不在”論壇,并發(fā)表題為《真開(kāi)放·全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)》的主題演講。

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

(圖為獵豹移動(dòng)董事長(zhǎng)兼CEO傅盛)


傅盛表示,即便是在今天的生產(chǎn)線上,也很難解決設(shè)備智能化的問(wèn)題,而AI讓機(jī)器第一次擁有了人類的感知能力,也讓物聯(lián)網(wǎng)終端更聰明。這是一個(gè)巨大的分水嶺,使得AIoT的概念開(kāi)始出現(xiàn)。在行業(yè)和自身的變革背景下,獵豹移動(dòng)攜旗下人工智能公司獵戶星空,研發(fā)了包括語(yǔ)音識(shí)別、視覺(jué)識(shí)別、室內(nèi)導(dǎo)航平臺(tái)等在內(nèi)的行業(yè)唯一全鏈條AI技術(shù)。

他說(shuō)到,“我們未來(lái)不會(huì)單做一款硬件,我們致力于打造AI賦能的云端操作系統(tǒng),跟開(kāi)發(fā)者一起做更多的物聯(lián)網(wǎng)設(shè)備?!?/strong>

以下是演講全文:

首先,我花一點(diǎn)時(shí)間介紹一下獵豹移動(dòng)。獵豹移動(dòng)是一家經(jīng)歷過(guò)三次跨越的公司,2010年由我自己創(chuàng)辦的可牛影像和金山安全合并而成。

當(dāng)時(shí)我們經(jīng)歷的第一波是PC殺毒軟件免費(fèi)化,實(shí)現(xiàn)了第一次的增長(zhǎng)。

第二波在移動(dòng)互聯(lián)網(wǎng)的時(shí)候,我們碰到了強(qiáng)大的對(duì)手,決定出海。我們是第一家大規(guī)模的把用戶做到海外的中國(guó)公司。今天,獵豹移動(dòng)大概有5億多的月度活躍用戶,其中80%來(lái)自于海外,完全走出了一條不一樣的曲線,我們內(nèi)部叫做“天外飛仙”。所以我們現(xiàn)在依然是Google工具排行榜的第一,我們游戲的下載次數(shù)在全球接近20億次。

第三波是在2014年上市以后。我當(dāng)時(shí)就意識(shí)到,整個(gè)移動(dòng)互聯(lián)網(wǎng)的風(fēng)口將盡,我們需要尋找下一個(gè)機(jī)會(huì)。我們?cè)诠韫取⒁陨卸纪顿Y了基金,由此看到了人工智能的機(jī)會(huì)。

AI讓機(jī)器擁有感知能力 全力以赴打造全鏈條AI技術(shù)

我對(duì)人工智能有一些自己的理解和思考,我們講了很久的物聯(lián)網(wǎng)、智能硬件,其實(shí)在AI或者人工智能出現(xiàn)之前,所有的智能硬件都是偽智能硬件。那個(gè)時(shí)候的智能硬件本質(zhì)上是聯(lián)網(wǎng)硬件,你要掏出手機(jī)進(jìn)行操作。大概在三五年前,各種智能硬件的行業(yè)都起來(lái)了,但是很快這個(gè)行業(yè)又衰落了。

我甚至想要把機(jī)器人行業(yè)劃分成兩個(gè)分水嶺。在AI出現(xiàn)之前的機(jī)器人本質(zhì)上都是自動(dòng)化機(jī)器,沒(méi)有人的屬性。我們看產(chǎn)線上那么多漂亮的機(jī)械手,其實(shí)都是通過(guò)非常原始的編程和自動(dòng)化的設(shè)備進(jìn)行生產(chǎn)的。即便今天在生產(chǎn)線上,也很難解決智能化的問(wèn)題。

傅盛:AI讓機(jī)器有了人類的感知,全鏈條AI技術(shù)賦能物聯(lián)網(wǎng)

但AI出現(xiàn)以后,第一次讓機(jī)器有了人類的感知能力,我們以前的攝像頭看到的都是0101等一串?dāng)?shù)字,但今天攝像頭看到的是人臉;以前看到的語(yǔ)音是波形,我們現(xiàn)在看到的語(yǔ)音是文字。

機(jī)器開(kāi)始有了人類的感知能力,使得AIoT的概念開(kāi)始出現(xiàn),看到這個(gè)機(jī)會(huì)以后,我們就去做了行業(yè)唯一的全鏈條AI技術(shù)。包括語(yǔ)音識(shí)別、視覺(jué)識(shí)別、導(dǎo)航、機(jī)械臂、麥克風(fēng)陣列等,為什么要做呢?

這是從內(nèi)外兩個(gè)方面思考的。

第一個(gè),獵豹移動(dòng)在以前做的太快了。我們就做一個(gè)小工具,居然就上市了。后來(lái)等到Google發(fā)政策不讓我們做工具,手機(jī)廠商都開(kāi)始自己做工具的時(shí)候,我們的日子就變得很艱難。所以我當(dāng)時(shí)就想,擁有自己的底層技術(shù)很關(guān)鍵。

第二個(gè),因?yàn)锳I行業(yè)還處于早期。很多技術(shù)都不完善,或者沒(méi)有形成產(chǎn)業(yè)分工。但很多開(kāi)發(fā)者,拿一塊板子,拿一個(gè)所謂的開(kāi)放平臺(tái),就想實(shí)現(xiàn)很好的語(yǔ)音識(shí)別效果,其實(shí)是非常難的。以智能音箱為例,換一個(gè)外殼罩上去,算法就得調(diào)整,因?yàn)榛祉懖灰粯印>拖?,在你的耳朵上加一個(gè)耳塞,聽(tīng)力就可能大幅度下降,和你的大腦聰不聰明沒(méi)關(guān)系。所以整個(gè)人工智能產(chǎn)業(yè)的鏈條都非常新,又沒(méi)有足夠的分工。

第三個(gè),我意識(shí)到,AI其實(shí)并不算是一個(gè)不可逾越的黑科技。很多人都說(shuō),BAT才能做AI,或者人家的積累更好一點(diǎn)。但是今天看來(lái),開(kāi)源代碼會(huì)遠(yuǎn)遠(yuǎn)豐富于任何一個(gè)時(shí)代。很多大洋彼岸的論文出現(xiàn)之后,中國(guó)的工程師就很快把它實(shí)現(xiàn)了。所以,好處就在于,AI大大降低了技術(shù)壁壘。而且AI使得以前很多公司的積累變得無(wú)效,大家處在同一起跑線上。我們認(rèn)為,這是一個(gè)彎道超車的好機(jī)會(huì)。

所以,我們當(dāng)時(shí)就下定決心,把所以技術(shù)全都干了一遍,全力以赴打造全鏈條 AI 技術(shù)。全干一遍的好處就是,我們能夠自主調(diào)整很多細(xì)節(jié)。

語(yǔ)音交互實(shí)現(xiàn)了命令的自然化 可能顛覆手機(jī)的中心地位

我認(rèn)為真正有智能的第一個(gè)硬件品類,應(yīng)該是智能音箱,我一直在想,語(yǔ)音識(shí)別是什么東西?今天有人談“語(yǔ)義理解能力超過(guò)人”。只要看到這種標(biāo)題,基本上都是騙子。

為什么這么說(shuō)?在語(yǔ)義的理解上,AI離人有巨大的差距。因?yàn)檎Z(yǔ)言是人類超級(jí)牛的發(fā)明,你能夠把你對(duì)世界的理解,壓縮成一串很短的文字輸入給對(duì)方,對(duì)方聽(tīng)完以后,能把這個(gè)圖像、事件還原出來(lái),這是個(gè)相當(dāng)牛的能力,人類之間的交流是帶有巨大的信息壓縮和背景知識(shí)的。

所以,今天機(jī)器完全做不到。AI想在閱讀理解上超過(guò)人類,那是在一個(gè)很有限的短文章里,沒(méi)有實(shí)際意義。

真正的語(yǔ)音操作是什么?我認(rèn)為它的本質(zhì)是實(shí)現(xiàn)了命令的自然化。喬布斯有一句話說(shuō),每一次交互操作的演進(jìn)都是一次革命。蘋(píng)果有幸抓住了兩次革命,第一個(gè)是抓住了鍵盤(pán)和鼠標(biāo),第二個(gè)是抓住了觸摸屏。

今天的手機(jī)不是因?yàn)樗卸嗝粗悄?,而是因?yàn)樗袕?qiáng)大的處理能力,你可以非常方便地touch。所以手機(jī)立刻取代了以前的PC、電視,成為了你的中心位置。

但語(yǔ)音使得手機(jī)的中心位置有可能被顛覆掉,你想象一下,語(yǔ)音是什么?比如,你想看《延禧攻略》,以往你需要從口袋里掏一個(gè)東西,解鎖、搜索,未來(lái)可以用語(yǔ)音就直接喚醒:我想看《延禧攻略》。

我甚至認(rèn)為,雖然手機(jī)還是個(gè)非常關(guān)鍵性的設(shè)備,但下一代設(shè)備都可以變得去手機(jī)化。

兩年前,我們是業(yè)內(nèi)第二款做智能音箱的廠商。我們(聯(lián)合喜馬拉雅)做了一款小雅音箱,當(dāng)時(shí)很多人就問(wèn)我,智能音箱有多智能呢?我回答:你不要考慮它有多智能,你只要考慮它是個(gè)搖控器,能夠非常簡(jiǎn)單地點(diǎn)歌、了解天氣,設(shè)置鬧鐘。我們買(mǎi)來(lái)了對(duì)手的產(chǎn)品,我們發(fā)現(xiàn)點(diǎn)歌根本點(diǎn)不準(zhǔn),只有50%的準(zhǔn)確率。為什么?不是語(yǔ)音識(shí)別的問(wèn)題,而是內(nèi)容上的問(wèn)題。比如說(shuō)今天抖音出了個(gè)神曲叫《我們一起學(xué)貓叫》,你的曲庫(kù)里得有這首歌。有的時(shí)候用戶說(shuō)叫“學(xué)貓叫”,有的說(shuō)喵喵喵,有多種的說(shuō)法。這不是一個(gè)智能的活兒,這是個(gè)產(chǎn)品的活兒。

所以我們就把音樂(lè)的點(diǎn)播率和內(nèi)容的點(diǎn)播率,這一件事兒做好了。當(dāng)時(shí),我覺(jué)得智能音箱的核心不是它有多智能,而是一種新的交互模式。這種新的交互模式本質(zhì)上就是一個(gè)搖控器,它把極其復(fù)雜難用的搖控器給改掉了,這個(gè)進(jìn)步是非常巨大的。

iPhone剛出來(lái)的時(shí)候,大家說(shuō)這個(gè)沒(méi)有全鍵盤(pán)、沒(méi)有硬鍵盤(pán)怎么用,輸入內(nèi)容太慢了。但就是因?yàn)樗奖?,你可以容忍它非常多不夠快速的地方?/p>

我們賦能了很多物聯(lián)網(wǎng)的中樞,我堅(jiān)定的認(rèn)為,語(yǔ)音是下一代操作系統(tǒng)的界面,它一定可以使得物聯(lián)網(wǎng)的很多設(shè)備變得智能??梢愿阒苯咏换ィ恍枰ㄟ^(guò)手機(jī)APP的方式,它自己就被賦能了。我們跟很多廠商合作了很多款音箱,因?yàn)槲覀冇X(jué)得打音箱上的戰(zhàn)役可能打不過(guò),但是合作是有機(jī)會(huì)的。

人工智能不會(huì)顛覆人 只要一點(diǎn)突破就會(huì)帶來(lái)變革

我們還做了一款能移動(dòng)的售賣(mài)機(jī)——零售機(jī)器人豹小販,它會(huì)主動(dòng)問(wèn)你是否需要商品,用戶掃描二維碼就可以購(gòu)買(mǎi)。看到人多的地方它就會(huì)過(guò)去,因?yàn)樗腥四樧R(shí)別技術(shù)。以前,售賣(mài)機(jī)只能放在一個(gè)地方,如今,自動(dòng)售賣(mài)機(jī)的售賣(mài)效率,大概是傳統(tǒng)的三到五倍,用互聯(lián)網(wǎng)的定律看,當(dāng)多一個(gè)鏈接,互聯(lián)網(wǎng)就損失了50%以上的流量。而在線下零售端,當(dāng)你從原有的位置走出來(lái),讓用戶看到有一點(diǎn)點(diǎn)改進(jìn),效率的改變是巨大的。

在機(jī)械臂方面,我專門(mén)去發(fā)那科看過(guò)他們的生產(chǎn)線。我個(gè)人覺(jué)得,在精密制造上和日本、德國(guó)企業(yè)去比拼,是沒(méi)有機(jī)會(huì)的。因?yàn)樗麄兪侨甑姆e累,可以用機(jī)械臂生產(chǎn)機(jī)械臂。但是他們面臨一個(gè)問(wèn)題:整個(gè)產(chǎn)線投產(chǎn)周期非常長(zhǎng),他要改變一個(gè)產(chǎn)品的時(shí)候,整條產(chǎn)線都要變,成本非常高。

我一直在想,AI 出現(xiàn)之后,可能不需要精密的機(jī)械臂,來(lái)做生產(chǎn)。我想到我奶奶的手,哆哆嗦嗦的,但她仍然能夠織毛衣,還可以穿針引線。核心不是因?yàn)樗募∪饽軌蚨嗝淳_地控制,而是因?yàn)樗苡醚劬ψ鲎詈笠稽c(diǎn)點(diǎn)調(diào)整。

受此啟發(fā),我們?cè)跈C(jī)械臂上加上了攝像頭,使得它去抓杯子的時(shí)候,杯子怎么樣放都可以抓得到,這樣可以降低對(duì)機(jī)械臂精度的要求。

做機(jī)械臂的機(jī)床,如果從日本買(mǎi),大概需要 2000 萬(wàn)的投資,六個(gè)月之后拿貨,我們現(xiàn)在正在嘗試用韓國(guó)產(chǎn)的機(jī)床為我們做諧波減速器,未來(lái)可能用國(guó)產(chǎn)的機(jī)床。雖然精度降低了一點(diǎn)點(diǎn),由于由于有視覺(jué)技術(shù),所以它最后肯定能完成動(dòng)作。

因?yàn)闄C(jī)械臂最大的成本就來(lái)自于諧波減速器,我們正在做的機(jī)械臂,未來(lái)可以降到市場(chǎng)價(jià)格的三分之一。當(dāng)機(jī)械臂的價(jià)格降低,可能會(huì)產(chǎn)生新的、比工業(yè)市場(chǎng)大十倍的市場(chǎng),市場(chǎng)增大十倍之后,成本又會(huì)進(jìn)一步降低。在 AI 賦能之后,機(jī)械臂是有可能實(shí)現(xiàn)跨越式增長(zhǎng)的。

在接待服務(wù)方面,如果大家有興趣的話,可以去獵豹移動(dòng)參觀一下。我們的前臺(tái)已經(jīng)是機(jī)器人接待了,我們是一家沒(méi)有前臺(tái)的公司,只有機(jī)器人。你來(lái)的時(shí)候,我在OA上提一個(gè)申請(qǐng),然后你會(huì)收到一條數(shù)字碼,機(jī)器人就會(huì)過(guò)來(lái)。你跟它說(shuō)“我來(lái)面試”或者開(kāi)會(huì),把數(shù)字碼輸上,它給你拍張照,在我們的閘機(jī)上刷一下臉,你就可以進(jìn)入公司,它也會(huì)帶你去會(huì)議室。

今天講人工智能,很多人太強(qiáng)調(diào)所謂顛覆人的智能,這條路我還沒(méi)有看到顛覆人的地方。但核心是有可能實(shí)現(xiàn)一點(diǎn)點(diǎn)突破,比如說(shuō)它能夠把原來(lái)的0101這種信號(hào),對(duì)應(yīng)成真正的人臉和語(yǔ)音的字節(jié)的時(shí)候,其實(shí)我覺(jué)得這個(gè)機(jī)會(huì)就已經(jīng)非常非常巨大了。它會(huì)讓很多設(shè)備具備人的感知能力,在一個(gè)非常垂直的領(lǐng)域,完成一點(diǎn)點(diǎn)工作。這一點(diǎn)點(diǎn)工作,可能會(huì)帶來(lái)巨大的變革。

我們最近剛跟一個(gè)酒店簽約,我們的音箱進(jìn)酒店了。以后你到房間以后,你就直接可以說(shuō),開(kāi)燈。你可以跟音箱說(shuō):“給我來(lái)支牙刷”,酒店系統(tǒng)就會(huì)收到,服務(wù)員很快就會(huì)把牙刷送過(guò)來(lái)。這樣的話,通過(guò)人工智能技術(shù)可以讓物聯(lián)網(wǎng)的設(shè)備變得更聰明,而且真正可以使得照明、空調(diào)等設(shè)備變得互聯(lián)互通,非常好用。

我希望機(jī)器人也好,音箱也好,都能跟各行各業(yè)合作,我們的本質(zhì)不是想做一個(gè)硬件,我們的本質(zhì)還是想做一個(gè)AI賦能的云端操作系統(tǒng),跟開(kāi)發(fā)者一起做更多的物聯(lián)網(wǎng)設(shè)備。謝謝大家!