#導入語料庫訓練說方言也難不倒
🔺英語語系🔺
2016年10月,微軟運用卷積神經網路(CNN)及長短時記憶模型(LSTM)訓練的語音識別系統,在標準口語資料庫Switchboard上測試的詞錯率(WER)已降至5.9%,樹立機器語音辨識準確率超越人類專業速記員的里程碑;在自然語言理解方面,2018年1月初,在業內被譽為機器閱讀理解界的頂級賽事,由史丹福大學發起的SQuAD機器閱讀理解挑戰賽上,微軟亞洲研究院開發的r-net+模型及阿里巴巴iDST開發的SLQA+模型前後刷新紀錄,其模型在閱讀理解文章後,可完全正確或部分正確回答問題的評分超越人類能夠達到的水準,不僅是自然語言處理領域的一大進展,結合AI語音技術亦能進一步開拓智慧客服、教育領域、新聞媒體及搜尋引擎等領域之應用,但值得注意的是這兩項標準測試都是採用標準文本或在無干擾的單純環境下進行,在真實情境下的運用還需要演算法、數據和模型上的創新與精進。
🔺中文語系🔺
百度發表的深度語音識別系統 Deep Speech 2對中文語音的識別準確率可達到97%,音訊轉寫的速度較人工速記快1.67倍,MIT科技評論遴選其為2016年十大突破技術之一,轉寫逐字稿可為人類省下四成工時。科大訊飛在MIT於2017年發表「全球最聰明的50家企業」中名列全球第6,其以眾包方式採集22種方言的語料庫,運用大量的卷積層對語音信號進行模型建構,訊飛輸入法可識別包括粵語、湖南語、客家語…等多種方言口音。
全文網址:https://goo.gl/CmJnA8
導入語料庫訓練說方言也難不倒 在 國立屏東教育大學進修暨研究學院 - 屏東大學機構典藏NPTUIR 的推薦與評價
說,女人生小孩就像掉了十八朵花一樣,後期的我真的是挺著肚子舟車. 勞頓,往反高雄工作,屏東念書,還在火車上練就了站著吃飯、喝湯的. 好手,要生小孩也要生論文, ... ... <看更多>
導入語料庫訓練說方言也難不倒 在 訊飛輸入法-在PTT/IG/網紅社群上服務品牌流行穿搭-2022-08(持續更新) 的推薦與評價
訊飛輸入法-臉書推薦/討論/評價在PTT、Dcard、IG整理一次看. #導入語料庫訓練說方言也難不倒 英語語系 2016年10月,微軟運用卷積神經網路(CNN)及長短時記憶模. ... <看更多>