中國福建網(wǎng)

當前位置:中國福建網(wǎng) > 國內(nèi) > 正文

2018機器閱讀理解技術競賽“發(fā)榜” 百度開放數(shù)據(jù)集成就“頭號玩家”

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2018-05-28

┊文章閱讀:

近日,由中國中文信息學會(CIPS)、中國計算機學會(CCF)和百度公司聯(lián)手舉辦的“2018機器閱讀理解技術競賽”落下帷幕。來自北京奇點機智科技有限公司的韋琬和劉家驊組成的Naturali團隊憑借在自然語言處理(NLP)領域多年的積累與沉淀,從國內(nèi)外1000多支報名隊伍中脫穎而出榮獲第一名。大賽更多排名信息,可登錄2018機器閱讀理解技術競賽官網(wǎng)http://mrc2018.cipsc.org.cn/查看。

云圖片

本次競賽旨在推動語言理解和人工智能領域技術和應用的發(fā)展,通過機器閱讀文本,進而回答和閱讀內(nèi)容相關的問題。比賽涉及到了語言理解、知識推理、摘要生成等復雜技術,極具挑戰(zhàn)。大賽有效推動了機器閱讀理解技術的發(fā)展,更為下一屆機器閱讀理解技術競賽的舉辦積累了寶貴經(jīng)驗。競賽將在第三屆“語言與智能高峰論壇”舉辦技術交流和頒獎,數(shù)據(jù)集論文可登錄https://arxiv.org/abs/1711.05073查看,供業(yè)界交流使用。

云圖片

用行動見初心,百度提供迄今規(guī)模最大的中文閱讀理解數(shù)據(jù)集

本次大賽受到了全球機器閱讀理解領域研究者的廣泛關注,具有覆蓋面廣,參與度高,活躍度強的特點。競賽注冊報名團隊共達1062支,累計收到系統(tǒng)結果1489份。競賽基于測試集的人工標注答案,采用ROUGH-L和BLEU4作為評價指標,以ROUGH-L為主評價指標。比賽期間排行榜高分不斷刷新,ROUGE-L評價指標由最初的35.96提升至終賽的63.38,接近半數(shù)的系統(tǒng)結果超過了基線系統(tǒng)。在各團隊的不懈努力下,參賽系統(tǒng)整體水平得到了顯著提升。

為了給予參賽者最大力度支持,本次競賽數(shù)據(jù)集來自搜索引擎真實應用場景,其中的問題為百度搜索用戶的真實問題,每個問題對應5個候選文檔文本及人工整理的優(yōu)質(zhì)答案,這是目前為止最大、最具挑戰(zhàn)性的中文閱讀理解數(shù)據(jù)集。

云圖片

眾所周知,近幾年來人工智能技術的迅速發(fā)展,離不開大量可供機器學習的數(shù)據(jù)的發(fā)布。此次百度公開閱讀理解數(shù)據(jù)集為學術界提供了迄今為止最大規(guī)模的真實應用場景下的數(shù)據(jù),也帶來了相對深層次的答案細節(jié)標注。數(shù)據(jù)中涵蓋的豐富信息,可覆蓋大量閱讀理解及問答的研究需求,并為其他的研究方向提供了大量可發(fā)掘利用的信息。毫無疑問,此次百度公開數(shù)據(jù)集對于推動機器閱讀理解技術乃至人工智能技術的發(fā)展都有著積極且重要的作用。

助力人才培養(yǎng),百度用“中國速度”輸送精英人才

依托在人工智能領域的發(fā)展,百度通過本次“2018機器閱讀理解技術競賽”為學術界和工業(yè)界提供了一個公開的閱讀理解技術交流平臺,協(xié)同多方力量共同打磨機器閱讀理解這一項人工智能的關鍵技術,共同發(fā)展共同進步,推動學術界和工業(yè)界最新研究成果轉化為實際生產(chǎn)力。

百度此次與學界、業(yè)界共同舉辦中文閱讀理解技術競賽,對人才發(fā)掘與培養(yǎng)的決心顯而易見。通過開展諸如機器閱讀理解技術競賽、百度之星開發(fā)者大賽、PaddlePaddle AI大賽等眾多人工智能行業(yè)競賽,開放海量優(yōu)質(zhì)AI數(shù)據(jù)資源與行業(yè)資源賦能AI行業(yè)的優(yōu)質(zhì)人才,為研究者提供強大的學習驅(qū)動力與創(chuàng)造力。正如本次評測委員會成員劉凱所言,“本次競賽期望進一步普及機器閱讀理解技術、降低技術門檻,吸引并培養(yǎng)更多的技術人才,推動我國人工智能的學術和產(chǎn)業(yè)的發(fā)展?!?/p>

本次競賽結束后,對AI數(shù)據(jù)集有興趣的技術人才可以在百度BROAD平臺自由下載已公開的閱讀理解數(shù)據(jù)集,并通過平臺提交測試集結果進行系統(tǒng)效果測試,持續(xù)了解和關注百度閱讀理解數(shù)據(jù)集。除了閱讀理解數(shù)據(jù)集,百度AI公開數(shù)據(jù)集計劃BROAD(Baidu Research Open-Access Dataset)還發(fā)布了視頻和圖像數(shù)據(jù)集。

我們有理由相信,未來,百度將繼續(xù)在AI人才培養(yǎng)中發(fā)揮重要作用,聯(lián)合產(chǎn)學研各方開展研究,培養(yǎng)人工智能領域的精英技術人才。

  • 新浪新聞
  • 百度搜索
  • 搜狗搜索
  • 京東商城
  • 企業(yè)慧聰
  • 新浪科技
  • 科技訊
  • 鵪鶉蛋價格
  • 唯美圖片