┊文章閱讀:次
人的耳朵能夠輕松分辨出歌曲的各種情緒,未來,機(jī)器也能如此。為了讓機(jī)器人也能聽懂人類創(chuàng)作的歌曲,法國在線音樂網(wǎng)站Deezer的研究人員開發(fā)了一種人工智能系統(tǒng),可以將某些音軌與情緒聯(lián)系起來。
Deezer的研究人員在Arxiv.org網(wǎng)站上發(fā)表了一篇新論文《基于音頻歌詞與深度神經(jīng)網(wǎng)絡(luò)的音樂情緒檢測》,在論文中,他們描述了這項(xiàng)工作的細(xì)節(jié)。研究人員表示,智能音樂情緒檢測在過去二十年里一直是一個活躍的研究領(lǐng)域,它包括自動確定聽音樂時感受到的情緒。在這項(xiàng)工作中,他們將專注于基于音頻信號和音軌、歌詞的多模態(tài)情緒檢測。
該團(tuán)隊(duì)引用心理學(xué)研究結(jié)果,表示在分析音樂所表達(dá)的情緒時,歌詞是密不可分的考慮因素,所以他們設(shè)計(jì)了一個神經(jīng)網(wǎng)絡(luò),分別提供音頻信號和word2vec(一種用于生成單詞嵌入的相關(guān)模型)嵌入訓(xùn)練160萬首歌詞。為了教它確定歌曲的情感,形成共鳴,他們選擇了一組超過100萬主流歌曲元數(shù)據(jù)的Million Song Dataset (MSD),這個數(shù)據(jù)庫和Last.fm(在線音樂服務(wù)商)的標(biāo)簽相關(guān)聯(lián),它們大多和描述情緒有關(guān),形成標(biāo)簽推薦的數(shù)據(jù)集,同時還用人工智能對標(biāo)簽中的14000個英語單詞進(jìn)行標(biāo)記,包括從負(fù)面到正面和從平靜到激情程度,作為歌曲情緒強(qiáng)度的標(biāo)記。
由于MSD不包含音頻信號和歌詞,因此團(tuán)隊(duì)將歌曲元數(shù)據(jù)映射到Deezer的目錄 - 特別是歌曲標(biāo)題,藝術(shù)家姓名和專輯標(biāo)題。其中大約60%的結(jié)果數(shù)據(jù)集 (總共18,644個音軌) 被用于訓(xùn)練模型,其中40%用于驗(yàn)證和測試。
與描繪和情緒相關(guān)的詞匯的經(jīng)典系統(tǒng)相比,深度學(xué)習(xí)模型在檢測方面更優(yōu)越。研究人員表示:“看起來這種性能的提升要?dú)w功于我們的模型能夠揭示并使用音頻和歌詞之間的中級相關(guān)性,特別是在預(yù)測效價的時候”。
Copyright @ 2013-2018 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。