中國福建網(wǎng)

當前位置:中國福建網(wǎng) > 國內(nèi) > 正文

機器學習新進展!給它衛(wèi)星俯瞰圖像,它能生成地面視角圖像

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2018-07-18

┊文章閱讀:

眾所周知,達芬奇的一些畫作以鳥的視角,展示了意大利的某些區(qū)域,其詳細程度在當時無與倫比——似乎只有照相機和飛機出現(xiàn)后才有可能。很多人都感到奇怪,他是怎么想象出那些細節(jié)的?但現(xiàn)在,研究人員正致力于解決一個“逆向”問題:如果給出一幅地表的衛(wèi)星圖像,那么從地面上看那個地區(qū)是什么樣子的?這樣的人工圖像能有多清晰?

現(xiàn)在,加州大學默塞德分校的鄧學清(Xueqing Deng,音譯)和他的同事為我們提供了答案。他們訓練一個機器學習算法,通過分析衛(wèi)星俯瞰圖像,來生成地面視角圖像。

這項技術是基于機器智能的一種形式,名為生成式對抗網(wǎng)絡,由兩個神經(jīng)網(wǎng)絡組成,分別是生成器和判別器。

判別器根據(jù)某些習得的標準,比如與長頸鹿有多相像,對生成器生成的圖像進行評估。通過使用判別器的輸出數(shù)據(jù),生成器逐漸學會生成形似長頸鹿的圖像。

在研究中,鄧學清團隊利用地面真實圖像和該地區(qū)衛(wèi)星圖像來訓練判別器。這樣一來,判別器就可以學會如何將地面視角圖像和俯瞰圖像聯(lián)系起來。

當然,數(shù)據(jù)集的質(zhì)量非常重要。研究人員把LCM2015地面覆蓋圖作為地面真實圖像。LCM2015提供了整個英國的土地類別,分辨率為1公里。不過,研究人員把數(shù)據(jù)限制在71x71公里的網(wǎng)格,包括倫敦和周邊地區(qū)。對于網(wǎng)格中的每個地點,他們從在線數(shù)據(jù)庫Geograph下載了地面視角圖像。

然后,研究人員用1.6萬組兩兩對應的俯瞰圖像和地面視角圖像來訓練判別器。

下一步是開始生成地面視角圖像。把4,000幅特定地點的衛(wèi)星圖像輸入生成器,利用判別器的反饋,生成每個地點的地面視角圖像。研究人員用4,000幅俯瞰圖像進行系統(tǒng)測試,與地面真實圖像相比較。

結果非常有意思。系統(tǒng)根據(jù)俯瞰圖像生成的圖像貼近實際,只不過質(zhì)量較低。生成的圖像捕捉到了地面的基本特征,比如是否有道路,是農(nóng)村還是城市等等。“生成的地面視角圖像看起來自然,但不出所料,它們?nèi)狈φ鎸崍D像的那種細節(jié)?!编噷W清團隊說。

這項技術很巧妙,但用處有多大?地理學家的一個重要任務,是根據(jù)用途對土地進行分類,比如是農(nóng)村還是城市。

地面視角圖像對此至關重要。然而,現(xiàn)有的地圖往往是稀疏的,尤其是農(nóng)村地區(qū)。因此,地理學家不得不在圖像之間進行插入補全,這個過程只比瞎猜要好一點。

現(xiàn)在,鄧學清團隊的生成式對抗網(wǎng)絡,提供了一個確定土地用途的全新方法。地理學家如果想知道任何地點的地面視角圖像,只需要使用這個神經(jīng)網(wǎng)絡,根據(jù)衛(wèi)星圖像來創(chuàng)建地面視角圖像。

鄧學清團隊甚至對插入補全和圖像生成進行了比較。結果顯示,在確定土地用途時,圖像生成技術的準確率為73%,而插入補全方法的準確率只有65%。

這項有趣的技術可以使地理學家的工作變得更加簡單。但鄧學清團隊有更大的野心。他們希望改進圖像生成過程,生成更加精細的地面視角圖像。達芬奇肯定會對此佩服不已。

翻譯:于波

校對:李莉

編輯:穎仔

來源:Technology Review

造就:劇院式的線下演講平臺,發(fā)現(xiàn)最有創(chuàng)造力的思想

  • 新浪新聞
  • 百度搜索
  • 搜狗搜索
  • 京東商城
  • 企業(yè)慧聰
  • 新浪科技
  • 科技訊
  • 鵪鶉蛋價格
  • 唯美圖片