┊文章閱讀:次
? ? 最近抖音上很多火爆的段子,辦公的白領(lǐng)在短短幾秒將長長的打印文本變?yōu)殡娮訖n,速度快得令人咂舌。更讓人驚訝的是,這種高效錄入工具竟然不是專門的App而是訊飛輸入法。訊飛輸入法在安卓9.1版中更新OCR識別引擎,進一步提升文字掃描的場景泛化能力,實測也發(fā)現(xiàn)新版的拍照輸入識別率相較上一版提升了約30%。據(jù)悉,此項源頭技術(shù)在CVPR 2019等多項文檔分析與識別測試任務(wù)中均獲得行業(yè)冠軍,可見其背景實力的雄厚。
?
??
? ? 通常情況下,需要將圖片或手寫內(nèi)容轉(zhuǎn)換成文字時,我們需要下載專門的App進行操作(并且這樣的App其實多數(shù)需要付費的),使用體驗也是參差不齊??紤]到用戶在這方面的使用需求越來越強烈,訊飛輸入法作為文字輸入工具,不僅在語音輸入方面造詣頗深,其他輸入方式也在不斷探索。譬如基于圖像識別技術(shù)打造的文字掃描,切實幫助提升輸入效率。
?
??
? ? 以往需要費時費力手動錄入焦急而忙碌的場面,現(xiàn)在只需在訊飛輸入法中點擊“文字掃描”功能拍一張照片,短短3-5秒鐘即可生成可編輯的文本,甚至圖片文字、手寫字體、中英混合甚至連標(biāo)點符號也都能做到精準識別,生成的電子版更方便編輯和更新,很大程度上解放了我們的雙手。
??
? ? 一直以來,科大訊飛在手寫文字識別領(lǐng)域已深耕多年。與將字符識別和位置關(guān)系識別分別建模的傳統(tǒng)數(shù)學(xué)公式識別思路不同,訊飛輸入法內(nèi)置最新的圖像識別系統(tǒng)正是借鑒了手寫文字識別技術(shù)中基于空間注意力機制的Encoder-Decoder思想,實現(xiàn)了數(shù)學(xué)公式的字符和位置關(guān)系的端到端識別,同時提出了多尺度空間注意力機制以解決由字符尺寸差異較大帶來的識別字符丟失問題。此外,針對不同書寫者書寫風(fēng)格迥異的問題,提出了空間注意力引導(dǎo)機制和時間注意力機制,從空間和時間兩個維度上提升注意力的準確度,最后融合了多種不同模態(tài)的信息提升了系統(tǒng)最終決策的效果。
?
? ? 基于A.I.核心技術(shù),科大訊飛在應(yīng)用領(lǐng)域正積極落地。特別在移動互聯(lián)網(wǎng)領(lǐng)域,以訊飛輸入法為代表的拍照輸入做到了行業(yè)最佳。當(dāng)然更重要的是,這一功能大大提升了工作效率。正所謂“時間就是金錢”,這才是訊飛輸入法“文字掃描”功能的價值利益點所在。
Copyright @ 2013-2018 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。