┊文章閱讀:次
在全球經(jīng)濟(jì)一體化的今天,中文信息科技遍布生活、娛樂(lè)、學(xué)習(xí)等各個(gè)方面,成為現(xiàn)代人類日常生活不可缺少的重要組成部分。然而,在上個(gè)世紀(jì)70年代,讓漢字進(jìn)入計(jì)算機(jī)曾一度被認(rèn)為是“不可能完成的任務(wù)”,而王選院士帶領(lǐng)北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所(下稱北大計(jì)算機(jī)所)北大科研團(tuán)隊(duì)研制的“漢字信息處理與激光照排技術(shù)”,成功破解了這一難題,從此印刷業(yè)從“鉛與火”的時(shí)代邁入“光與電”的新紀(jì)元。
然而,成功的背后是王選攻堅(jiān)克難、默默無(wú)聞地付出:在當(dāng)時(shí),因?yàn)閲?guó)產(chǎn)計(jì)算機(jī)速度慢,存貯量小,而漢字的字?jǐn)?shù)多,字號(hào)大小不一,又有多種字體,所以如何將信息量龐大的漢字自如地在計(jì)算機(jī)中存儲(chǔ)和輸出成為主要技術(shù)難關(guān)。經(jīng)反復(fù)鉆研,王選發(fā)明了“輪廓加參數(shù)”的漢字信息壓縮法和高速?gòu)?fù)原技術(shù),使?jié)h字的存儲(chǔ)量被總體壓縮500-1000倍,并實(shí)現(xiàn)了漢字字形每秒710字的快速?gòu)?fù)原以及變倍和變形時(shí)的高度保真,解決了這一世界級(jí)的技術(shù)難題。
不僅如此,在王選院士的帶領(lǐng)和精神感召下,團(tuán)隊(duì)還研發(fā)出全程數(shù)字化的“報(bào)業(yè)數(shù)字資產(chǎn)管理系統(tǒng)”,告別紙與筆、開(kāi)啟數(shù)字播控的“數(shù)字化音視頻控制技術(shù)研究及應(yīng)用”,擺脫磁帶束縛、“基于數(shù)字版權(quán)保護(hù)的電子圖書(shū)出版及應(yīng)用系統(tǒng)”、“跨媒體智能識(shí)別技術(shù)”、“個(gè)性化字體生成技術(shù)”、“人工智能寫稿機(jī)器人(21.25 -2.34%,診股)”等前沿科技,其研發(fā)的各項(xiàng)技術(shù)多次促進(jìn)我國(guó)相關(guān)行業(yè)實(shí)現(xiàn)了技術(shù)變革和產(chǎn)業(yè)顛覆性發(fā)展,產(chǎn)生了重大的社會(huì)與經(jīng)濟(jì)效益。
今年是北大建校120周年,也是北大計(jì)算機(jī)所建所35周年,記者借此機(jī)會(huì)走訪了中國(guó)最早的計(jì)算機(jī)科學(xué)研究機(jī)構(gòu),也是產(chǎn)業(yè)化落地效果最為顯著的研究機(jī)構(gòu)之一——北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所,與團(tuán)隊(duì)成員探討了在現(xiàn)代智能化科技發(fā)展大環(huán)境下,如何堅(jiān)守“科技頂天、市場(chǎng)立地”的王選精神傳承,堅(jiān)守科技強(qiáng)國(guó)之初心,讓科研技術(shù)服務(wù)大眾生活。
弘揚(yáng)王選精神,發(fā)展王選事業(yè)
Q:這不斷發(fā)展的35年對(duì)北大、對(duì)計(jì)算機(jī)所有什么意義?
郭宗明(北大計(jì)算機(jī)所所長(zhǎng)):簡(jiǎn)單可以歸納為王選精神在傳承,王選事業(yè)在發(fā)展。王老師的精神有很多,不同人有不同理解,比如好人精神、科研執(zhí)著精神等。從一個(gè)單位的角度來(lái)講,也就是“頂天立地”,頂天指的是最先進(jìn)的科學(xué)技術(shù),立地就是大范圍科技成果的應(yīng)用。到目前為止我們研究所還是堅(jiān)持這樣一個(gè)作風(fēng),我們要面向應(yīng)用,哪怕是短期沒(méi)有應(yīng)用的,長(zhǎng)期有應(yīng)用前景的,這也是我們研究所一直堅(jiān)持的。
首先是做面向應(yīng)用的研究。我們研究所當(dāng)然也做基礎(chǔ)研究,但是我們的特點(diǎn)應(yīng)該還是面向應(yīng)用的研究,也就是我們的研究成果最后都是要落地的。我們也有一些研究成果可能短期內(nèi),或者目前來(lái)看,并不一定能用到實(shí)踐當(dāng)中,比如所里某些研究成果是面向基于語(yǔ)義的,可能它并沒(méi)有一定在哪個(gè)行業(yè)里應(yīng)用,但是我們長(zhǎng)遠(yuǎn)的目標(biāo)是這樣。再如,所里研究的高考機(jī)器人也是一樣的,高考機(jī)器人背后的核心,背后通用的技術(shù)是人工智能,我們把它摘成一條一條的叫知識(shí)點(diǎn)、知識(shí)條目。
二是我們的應(yīng)用主要面向媒體,比如說(shuō)出版、廣播、電視、網(wǎng)絡(luò)媒體等等,當(dāng)然我們不限于媒體,我們也有語(yǔ)言、醫(yī)學(xué)、金融等等合作。但是要說(shuō)我們特點(diǎn)的話,我們主要是這兩個(gè),一個(gè)是面向應(yīng)用的研究,另一個(gè)就是應(yīng)用主要在媒體行業(yè)。
結(jié)合新技術(shù)落地應(yīng)用
Q:現(xiàn)在像微軟等企業(yè),他們都有自己的研究院,也是奔著應(yīng)用去的,這個(gè)跟北大計(jì)算機(jī)所有什么區(qū)別?
趙東巖(北大計(jì)算機(jī)所學(xué)術(shù)委員會(huì)委員):我覺(jué)得服務(wù)對(duì)象和立項(xiàng)需求不同。企業(yè)的研究院畢竟是企業(yè)投資來(lái)創(chuàng)辦的,自主研發(fā)的知識(shí)產(chǎn)權(quán)是為企業(yè)服務(wù)的。而高校研究所,它更強(qiáng)調(diào)通用性,服務(wù)對(duì)象更強(qiáng)調(diào)社會(huì)普遍性。在展開(kāi)合作時(shí),不拘泥于某個(gè)企業(yè)或單位綁定服務(wù)。所以,我們的研發(fā)確實(shí)面臨挑戰(zhàn),但我們的科學(xué)研究能從社會(huì)意義、社會(huì)發(fā)展角度得到前進(jìn)的動(dòng)力。
郭宗明:企業(yè)里面資源更豐富,它更偏重一些功能性的東西。北大計(jì)算機(jī)所純粹拼資源很難跟企業(yè)比,這種情況逼著我們更注重原創(chuàng)性研究,這是最大的區(qū)別。
Q:原創(chuàng)也很難,計(jì)算機(jī)所是怎么開(kāi)展原創(chuàng)研究的?
彭宇新(北大計(jì)算機(jī)所學(xué)術(shù)委員會(huì)委員):一些技術(shù)不是想做就能做的,它是需要一個(gè)長(zhǎng)時(shí)間的積累,我們的研究是基于先有積累。比如,我是做圖像視頻、媒體的分析和檢索的,這早在2000年就著手研究了。所以說(shuō)比較有門檻的項(xiàng)目技術(shù),經(jīng)過(guò)長(zhǎng)時(shí)間積累,做到人無(wú)我有的局面就比較有優(yōu)勢(shì)。
Q:計(jì)算機(jī)所目前在做哪些方面的工作?是高考機(jī)器人么?
趙東巖:這個(gè)項(xiàng)目實(shí)際上是為了檢驗(yàn)自然語(yǔ)言處理現(xiàn)在研究的技術(shù)水平,在實(shí)際的高考這種基于文本的問(wèn)答,就是以QA任務(wù)水平來(lái)設(shè)計(jì)的一個(gè)項(xiàng)目。
我們問(wèn)題的輸入跟考生一樣就是一個(gè)紙的卷子,我們?cè)诤竺嬉龌谖淖值恼Z(yǔ)言理解,讓機(jī)器來(lái)理解這個(gè)文字的語(yǔ)言,并且運(yùn)用相應(yīng)領(lǐng)域知識(shí),包括數(shù)學(xué)、語(yǔ)文、地理和歷史。我們這個(gè)課題組是偏重于地理這個(gè)試題的解答,運(yùn)用這個(gè)知識(shí),最后去生成相應(yīng)的答案,答案基本形式有選擇題和簡(jiǎn)答題這兩種。也就是說(shuō)一種是直接給ABCD,一種是生成文字,把你的答案再變成這個(gè)文字,這又涉及到計(jì)算機(jī)的生成語(yǔ)言來(lái)去解答。
人工智能是未來(lái)Q:據(jù)了解,研究所跟南方都市報(bào)、今日頭條開(kāi)展了合作,我想知道近期有沒(méi)有新的規(guī)劃?有沒(méi)有一些新的項(xiàng)目?
萬(wàn)小軍:我們會(huì)推出一個(gè)語(yǔ)音采訪跟寫稿一體化的人工智能機(jī)器人,它會(huì)面對(duì)一個(gè)被采訪對(duì)象主動(dòng)提問(wèn),用答復(fù)和基本的數(shù)據(jù)組成一個(gè)基本的稿件,未來(lái)兩三年會(huì)取代一些重復(fù)性、瑣碎的工作,使勞動(dòng)力結(jié)構(gòu)朝著智能化趨勢(shì)發(fā)展,為社會(huì)發(fā)展做出更多貢獻(xiàn)。
Q:北大計(jì)算機(jī)所下一個(gè)35年的規(guī)劃能描述下嗎?
郭宗明:因?yàn)楸贝蠖艘粋€(gè)2035年的規(guī)劃:要躋身到世界一流大學(xué)前列,所以把我們2035年的遠(yuǎn)景跟大家做個(gè)分享。
1966年,計(jì)算機(jī)界人工智能的先驅(qū)Marvin Minsky(英)教授描繪了這樣一個(gè)場(chǎng)景:一個(gè)計(jì)算機(jī)連著一個(gè)攝像頭,攝像頭看著一臺(tái)電視,并能和電視旁邊的觀眾敘述電視里邊放什么內(nèi)容。他描繪的場(chǎng)景,我們今天沒(méi)完全實(shí)現(xiàn),但我們有理由相信這個(gè)完全可以實(shí)現(xiàn)。到2035年,計(jì)算機(jī)研究所就能實(shí)現(xiàn)Marvin Minsky(英)教授描繪的場(chǎng)景,而且會(huì)超過(guò),我們的目標(biāo)是跨媒體語(yǔ)義理解和內(nèi)容生成。
Copyright @ 2013-2018 中國(guó)福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營(yíng)利性網(wǎng)站,部分圖片或文章來(lái)源于互聯(lián)網(wǎng)如果無(wú)意中對(duì)您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請(qǐng)您聯(lián)系,我們立即刪除。