GoogleCloud將語音轉(zhuǎn)文字服務(wù)擴(kuò)展到7種新語言
Google LLC今天升級了其為企業(yè)提供的人工智能轉(zhuǎn)錄服務(wù)Speech-to-Text,提供了擴(kuò)展的語言支持和更好的方言識別能力,這將擴(kuò)大該產(chǎn)品的潛在市場。
旗艦增強(qiáng)功能是增加了與七種新語言的兼容性:緬甸語,愛沙尼亞語,烏茲別克語,旁遮普語,阿爾巴尼亞語,馬其頓語和蒙古語。語音轉(zhuǎn)文字現(xiàn)在可以翻譯總共71種語言的語音。
Google Cloud語音產(chǎn)品經(jīng)理Calum Barnes表示:“這些進(jìn)步將我們的語音技術(shù)首次帶給了超過2億揚(yáng)聲器,并解鎖了更多功能,并提高了全球30億揚(yáng)聲器的準(zhǔn)確性。”
語音轉(zhuǎn)文本作為Google Cloud中的應(yīng)用程序編程接口提供,不僅將音頻文件轉(zhuǎn)換為文本,而且還提供允許企業(yè)自定義轉(zhuǎn)錄過程的高級功能。這些功能中的三個功能在今天的更新中得到了增強(qiáng)。
第一項(xiàng)功能被稱為語音適應(yīng)功能,使企業(yè)可以調(diào)整服務(wù)生成的文本。零售商可以訓(xùn)練語音轉(zhuǎn)文字識別在客戶服務(wù)呼叫中提到的難以轉(zhuǎn)錄的產(chǎn)品名稱,而分析軟件提供商則可能希望將一天中的諸如“四分之一到九分”的時間轉(zhuǎn)換為數(shù)字形式簡化處理。語音適應(yīng)現(xiàn)已提供68種新的語言和方言,包括法語,德語,西班牙語,日語和普通話。
Diarization是一種可以將單詞歸于特定說話者的功能,它正在獲得對10種新語言和方言的支持。Google的“增強(qiáng)型電話模型”已擴(kuò)展到英式英語,俄語和美國西班牙語。該模型于2018年推出,支持美國英語,可將通話質(zhì)量低的音頻的筆錄準(zhǔn)確性提高62%。
最后,新版本的語音轉(zhuǎn)文字功能會自動以18種以前不支持的語言(包括德語,法語,日語和瑞典語)向音頻文件添加標(biāo)點(diǎn)符號。
“這些新的語言和功能將幫助全球數(shù)十億說話者使用我們基于語音的界面和高質(zhì)量的語音識別,”巴恩斯寫道。
對于使用多種語言提供服務(wù)的公司,此更新應(yīng)該特別方便。例如,使用語音轉(zhuǎn)文本功能來提供實(shí)時視頻字幕服務(wù)或在支持電話期間分析客戶情緒的工具的公司現(xiàn)在可以在更多市場上出售其解決方案。