国产麻豆剧传媒精品网站,中文乱码视亚洲,91精品乱码一区二区三区,亚洲水蜜桃久久综合网站,欧美黄色免费看,91欧美一区二区三区综合在线

二維碼
企資網

掃一掃關注

當前位置: 首頁 » 企資快訊 » 匯總 » 正文

科大訊飛榮獲OpenASR國際低資源多語種語音

放大字體  縮小字體 發布日期:2021-11-19 00:27:22    瀏覽次數:9
導讀

華夏發展網訊 11月10日,OpenASR國際低資源多語種語音識別挑戰賽落下帷幕,科大訊飛-中科大語音及語言信息處理China工程實驗室聯合團隊(USTC-NELSLIP)參加了所有15個語種受限賽道和7個語種非受限賽道,全部取得第

華夏發展網訊 11月10日,OpenASR國際低資源多語種語音識別挑戰賽落下帷幕,科大訊飛-中科大語音及語言信息處理China工程實驗室聯合團隊(USTC-NELSLIP)參加了所有15個語種受限賽道和7個語種非受限賽道,全部取得第壹。

繼前不久榮獲多語言理解評測XTREME第一名之后,科大訊飛在多語種領域再次取得突破,在探索人機交互更自然、人人溝通無障礙得征程中又邁出了堅實得一步,也為華夏多語種語音語言技術趕超國際先進水平、華夏智能制造得全球化奠定了堅實得基礎。

從大語種向低資源多語種拓展

近年來,隨著深度學習技術得進步,漢語、英語等大語種語音識別技術日趨成熟,并獲得廣泛得應用。

相比之下,小語種語音識別因其語音數據資源難以獲取、難以標注、難以評估、語言可能稀缺等原因,已經成為世界性得研究難題,距離實用門檻仍有較大差距。

OpenASR挑戰賽更加小語種語音技術,探索如何使用少量得數據達到較好得效果,同時考察低資源語音識別基礎算法在多個語種上得推廣性。自2020年啟動以來,吸引了加拿大蒙特利爾信息科技研究中心、新加坡科技研究局、清華大學、騰訊等國內外知名研究機構和企業參與其中。

本次比賽共包含15個語種,涵蓋受限賽道、受限附加賽道和非受限賽道。

15個語種信息

其中受限賽道為各參賽單位必選項,每個語種只能使用組委會提供得10小時標注語音識別數據,受限附加賽道在受限賽道得基礎上允許使用開源得預訓練模型,而非受限賽道可以使用受限數據以外得數據。

科大訊飛-中科大聯合團隊在比賽中提出了基于語音和文本統一空間表達得半監督語音識別框架(Unified Spatial Representation Semi-supervised ASR,USRS-ASR),獲此佳績也驗證了該算法良好得推廣性。

聯合團隊全部15個語種受限賽道成績

聯合團隊參加得7個語種非受限賽道成績

領先技術亮相國際賽場

對于低資源語種而言,除了語音數據量較小外,其發音詞典大小、語料豐富性、標注準確度都遠不及常規水平。本次比賽中各個語種數據主要來自電話信道,口語化特征十分明顯,對話風格非常自由,也使得語音識別難上加難。

在受限賽道上,由于每個語種只有10小時語音數據,如何使用少量文本數據,利用無監督得方法增加語音訓練數據得多樣性至關重要。

科大訊飛-中科大聯合團隊創新運用Flow-TTS語音合成進行訓練數據擴增,并使用語音屬性解耦技術保證合成語音得多樣性。結果顯示,使用上述無監督數據擴增方案,能夠穩定、顯著地提升低資源語音識別任務得效果。

而在非受限賽道上,雖然參賽者可以利用公開得語音數據,但數據總量仍只有數百小時,而且語音數據和文本數據得量級差距十分明顯,這對于端到端識別框架來說,弊端更為明顯。

為了在端到端統一框架下,充分使用少量語音數據和海量文本數據,科大訊飛-中科大聯合團隊提出了基于語音和文本統一空間表達得半監督語音識別框架USRS-ASR。

首先,對于海量文本數據得使用,創新設計了文本掩碼語言模型任務、合成數據語音識別兩個目標,兩個任務聯合訓練以充分利用海量無監督文本;其次,設計了共享語言解碼模塊,實現了語音和文本隱層表達空間得統一,大大緩解了低資源語種得數據稀疏問題。

USRS-ASR框架示意圖

為全球提供多語種智能語音解決方案

就在不久前,工信部正式批復同意成立China智能語音創新中心、China高端智能化家用電器創新中心,科技創新正不斷引領產業升級。

值得注意得是,在這兩家級別高一點創新中心依托公司得股東名單中,“科大訊飛”均赫然在列。

持續致力于打造源頭技術創新策源地,科大訊飛正不斷追尋“頂天立地”得產業夢想。

多語種語音語言技術是萬物互聯時代實現人機交互得關鍵技術,也是實現“一帶一路”語言大互通得基礎技術。

從2014年開始,科大訊飛就一直在該方向得源頭技術創新及產業化應用上持續投入,并不斷挑戰實際應用中得技術難題。

經過多年得技術積累,除了中英以外,科大訊飛還具備了 69種語言得語音識別能力(其中35個語種準確率已超過90%),并已在新加坡、俄羅斯、印度、日本等China部署了海外站點,為各地開發者提供語音識別、語音合成、機器翻譯、圖文識別等語音語言服務,所有服務均在科大訊飛開放平臺開放。

多語種技術有力支撐了科大訊飛智能硬件產品創新。在翻譯終端方面,2016年11月發布得科大訊飛智能翻譯硬件,開創了AI翻譯機新品類;在會議同傳方面,2016年11月推出得訊飛聽見多語種字幕同傳系統,支持日韓法西等多國語言得同聲傳譯;在錄音筆方面,科大訊飛于2019年5月發布智能錄音筆,次年升級支持8種語言轉寫能力,2021年日本版智能錄音筆VOITER系列在日本一經上線,就取得單月銷售破千臺得亮眼成績。

除自身產品以外,科大訊飛也積極為“華夏制造”出海產品提供自主可控解決方案。

在手機、家電方面,為國內眾多手機廠商提供包括中英在內得多語種語音識別、語音合成能力解決方案,并聯合海爾研發多語種識別系統,助力其拓展東南亞市場;在車載交互方面,與上汽、長安、奇瑞等國內主要出海汽車提供商,以及俄羅斯汽車工程研究院(NAMI)等海外車廠開展多語種項目合作,覆蓋英語、俄語、日語、泰語、西班牙語、意大利語等數十個語種。

此外,科大訊飛得多語種相關技術能力也已應用于北京2022年冬奧會自家APP(冬奧通),助力冬奧信息溝通無障礙。

作為人工智能China隊,科大訊飛將繼續堅持源頭核心技術創新,聯合國內眾多研究機構與企業,構建多語言技術得系統性創新研發生態,共同推動華夏多語言技術進步與應用落地。(薛歌)

 
(文/小編)
免責聲明
本文僅代表作發布者:個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

粵ICP備16078936號

微信

關注
微信

微信二維碼

WAP二維碼

客服

聯系
客服

聯系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 日韩免费精品视频 | 99精品欧美一区二区三区 | 在线播放亚洲精品 | 久热精品免费视频 | 久久久精品免费视频 | 亚洲18av| 欧美日韩一级视频 | 在线观看国产一区二区三区99 | 亚洲一级生活片 | 中文国产成人精品久久水 | 不卡久久 | 国产精品电影院 | 欧美精品观看 | 激情五色天 | 在线精品视频免费观看 | 欧日韩视频 | 亚洲成片观看四虎永久 | 亚洲人人精品 | 日本免费一级片 | 国产精品高清视亚洲乱码 | 三妻四妾韩国电影完整版在线播放 | 91精品乱码一区二区三区 | 亚洲精品视频导航 | 一级片免费看 | 亚洲最大色网站 | 最新激情网址 | 日日lu | www.色五月| 国产成人精品三区 | 羞羞视频在线看免费 | 亚洲天堂男| 色亭亭 | 亚洲国产日韩在线人成下载 | 一区二区三区在线播放 | 久久网免费视频 | 亚洲欧美一区二区三区在线播放 | 狼狼色丁香久久女婷婷综合 | 无毛片 | 国色天香论坛社区在线视频 | 亚洲国产成人在线观看 | 伊人亚洲影院 |