┊文章閱讀:次
近日,由中國中文信息學會(CIPS)、中國計算機學會(CCF)和百度公司聯(lián)手舉辦的“2018機器閱讀理解技術競賽”落下帷幕。來自北京奇點機智科技有限公司的韋琬和劉家驊組成的Naturali團隊憑借在自然語言處理(NLP)領域多年的積累與沉淀,從國內(nèi)外1000多支報名隊伍中脫穎而出榮獲第一名。大賽更多排名信息,可登錄2018機器閱讀理解技術競賽官網(wǎng)http://mrc2018.cipsc.org.cn/查看。
本次競賽旨在推動語言理解和人工智能領域技術和應用的發(fā)展,通過機器閱讀文本,進而回答和閱讀內(nèi)容相關的問題。比賽涉及到了語言理解、知識推理、摘要生成等復雜技術,極具挑戰(zhàn)。大賽有效推動了機器閱讀理解技術的發(fā)展,更為下一屆機器閱讀理解技術競賽的舉辦積累了寶貴經(jīng)驗。競賽將在第三屆“語言與智能高峰論壇”舉辦技術交流和頒獎,數(shù)據(jù)集論文可登錄https://arxiv.org/abs/1711.05073查看,供業(yè)界交流使用。
用行動見初心,百度提供迄今規(guī)模最大的中文閱讀理解數(shù)據(jù)集
本次大賽受到了全球機器閱讀理解領域研究者的廣泛關注,具有覆蓋面廣,參與度高,活躍度強的特點。競賽注冊報名團隊共達1062支,累計收到系統(tǒng)結果1489份。競賽基于測試集的人工標注答案,采用ROUGH-L和BLEU4作為評價指標,以ROUGH-L為主評價指標。比賽期間排行榜高分不斷刷新,ROUGE-L評價指標由最初的35.96提升至終賽的63.38,接近半數(shù)的系統(tǒng)結果超過了基線系統(tǒng)。在各團隊的不懈努力下,參賽系統(tǒng)整體水平得到了顯著提升。
為了給予參賽者最大力度支持,本次競賽數(shù)據(jù)集來自搜索引擎真實應用場景,其中的問題為百度搜索用戶的真實問題,每個問題對應5個候選文檔文本及人工整理的優(yōu)質(zhì)答案,這是目前為止最大、最具挑戰(zhàn)性的中文閱讀理解數(shù)據(jù)集。
眾所周知,近幾年來人工智能技術的迅速發(fā)展,離不開大量可供機器學習的數(shù)據(jù)的發(fā)布。此次百度公開閱讀理解數(shù)據(jù)集為學術界提供了迄今為止最大規(guī)模的真實應用場景下的數(shù)據(jù),也帶來了相對深層次的答案細節(jié)標注。數(shù)據(jù)中涵蓋的豐富信息,可覆蓋大量閱讀理解及問答的研究需求,并為其他的研究方向提供了大量可發(fā)掘利用的信息。毫無疑問,此次百度公開數(shù)據(jù)集對于推動機器閱讀理解技術乃至人工智能技術的發(fā)展都有著積極且重要的作用。
助力人才培養(yǎng),百度用“中國速度”輸送精英人才
依托在人工智能領域的發(fā)展,百度通過本次“2018機器閱讀理解技術競賽”為學術界和工業(yè)界提供了一個公開的閱讀理解技術交流平臺,協(xié)同多方力量共同打磨機器閱讀理解這一項人工智能的關鍵技術,共同發(fā)展共同進步,推動學術界和工業(yè)界最新研究成果轉化為實際生產(chǎn)力。
百度此次與學界、業(yè)界共同舉辦中文閱讀理解技術競賽,對人才發(fā)掘與培養(yǎng)的決心顯而易見。通過開展諸如機器閱讀理解技術競賽、百度之星開發(fā)者大賽、PaddlePaddle AI大賽等眾多人工智能行業(yè)競賽,開放海量優(yōu)質(zhì)AI數(shù)據(jù)資源與行業(yè)資源賦能AI行業(yè)的優(yōu)質(zhì)人才,為研究者提供強大的學習驅(qū)動力與創(chuàng)造力。正如本次評測委員會成員劉凱所言,“本次競賽期望進一步普及機器閱讀理解技術、降低技術門檻,吸引并培養(yǎng)更多的技術人才,推動我國人工智能的學術和產(chǎn)業(yè)的發(fā)展?!?/p>
本次競賽結束后,對AI數(shù)據(jù)集有興趣的技術人才可以在百度BROAD平臺自由下載已公開的閱讀理解數(shù)據(jù)集,并通過平臺提交測試集結果進行系統(tǒng)效果測試,持續(xù)了解和關注百度閱讀理解數(shù)據(jù)集。除了閱讀理解數(shù)據(jù)集,百度AI公開數(shù)據(jù)集計劃BROAD(Baidu Research Open-Access Dataset)還發(fā)布了視頻和圖像數(shù)據(jù)集。
我們有理由相信,未來,百度將繼續(xù)在AI人才培養(yǎng)中發(fā)揮重要作用,聯(lián)合產(chǎn)學研各方開展研究,培養(yǎng)人工智能領域的精英技術人才。
Copyright @ 2013-2018 中國福建網(wǎng) 版權所有
聯(lián)系我們
免責聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權益構成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。