您現在的位置是:首頁 > 運動

喜馬拉雅聯合彩雲小夢打造首個講故事的AI電臺,從創作到演播均由AI完成

由 金融界 發表于 運動2022-06-07
簡介AI續寫和AI演播的跨界合作與強強聯合,使得音訊作品從文字到有聲化的創作,均由AI完成,登入喜馬拉雅搜尋“彩雲小夢”即可收聽由AI創作和AI演播的小說故事

均勻的均是不是多音字

近日,國內知名AI續寫應用彩雲小夢入駐喜馬拉雅,由其AI續寫的小說故事將由喜馬拉雅AI主播“喜小道”演播併發布在喜馬拉雅平臺。AI續寫和AI演播的跨界合作與強強聯合,使得音訊作品從文字到有聲,均由AI完成創作。聽友們將可以在喜馬拉雅上聽到由AI創作並演播的腦洞大開的故事,感受科技的力量。

當前,以網際網路、大資料、人工智慧(AI)等為代表的現代資訊科技日新月異,AI技術也越來越成熟,並正在深入地運用到我們生活的各個方面。在內容創作領域,如音訊內容的創作,以往都是先由真人作者創作出文字(文章/小說/詩歌等等),再經真人主播演播而成。

現在,就文字的創作而言,國內知名AI續寫應用“彩雲小夢”已經可以實現小說故事的AI創作。彩雲小夢是基於大規模語言模型自研的自然語言處理模型,是一個能夠進行各種型別文字創作的人工智慧:只需要給彩雲小夢一個1-1000字的開頭,它就能為你續寫出後面的故事。2021年9月,彩雲小夢在蘋果商店上線,獲評當月月度最佳應用。彩雲小夢此次官方入駐喜馬拉雅,其專輯節目中的作品均由AI續寫創作而成。

而將文字透過AI智慧技術有聲化,則是喜馬拉雅的強項。在音訊領域,將文字轉換為語音的技術統稱為TTS技術(Text-to-speech,語音合成),喜馬拉雅音訊演算法團隊自研的TTS框架目前已處於行業領先水平,其TTS前端文字處理分析模組已經能夠高精度、全自動地對文字進行多音字識別、韻律預測和風格分類,並已開發出可以實現多情感、多風格、多語種聲音的TTS技術模型,不僅可以演繹不同情緒的文字,還可以自動區分旁白、對白,並支援英文,極大地豐富了TTS能表達的情感和韻律。

喜馬拉雅此次與彩雲小夢續寫AI合作的AI主播“喜小道”就是基於喜馬拉雅自研的TTS框架,並採集頭部主播“喜道公子”的真聲打造而成。在此次合作中,彩雲小夢入駐為喜馬拉雅旗下網文創作平臺奇蹟文學的寫手,同時將其作品經“喜小道”有聲化後,釋出在喜馬拉雅平臺。AI續寫和AI演播的跨界合作與強強聯合,使得音訊作品從文字到有聲化的創作,均由AI完成,登入喜馬拉雅搜尋“彩雲小夢”即可收聽由AI創作和AI演播的小說故事。

除AI主播“喜小道”,目前,TTS技術已經支援喜馬拉雅在相聲評書、電子書、新聞等領域實現了突破,能夠高效地將新聞、書籍和文章中的大量文字資訊轉為音訊,這些TTS內容在上線後也獲得了較大的收聽量。比如,2021年,喜馬拉雅用TTS技術完美還原單田芳先生的聲音,並首次將單田芳先生的AI合成音應用於風格各異的書籍,用單式評書腔調,全新演繹聽眾耳熟能詳的經典之作,至今,喜馬拉雅上已有80多部運用還原自單田芳先生聲音製作的專輯。同時,隨著眾多主流媒體入駐喜馬拉雅,媒體們紛紛藉助喜馬拉雅TTS技術加速製作新聞類音訊節目,讓聽眾有了更多的渠道聽到更權威的新聞。值得一提的是,運用TTS技術重現單田芳聲音版本的《毛氏三兄弟》和歷史類作品,其聲音完播率遠超過普通人聲作品,這也為未來出版物大量有聲化提供了新的解決方案。

隨著AI技術的發展與成熟,其豐富的知識圖譜、自生成以及湧現性的特徵,為內容創作帶來變革:提升內容創作效率的同時,也讓內容本身變得多樣而豐富。在喜馬拉雅平臺上,已逐漸形成UGC、PGC、PUGC的音訊內容和創作者生態。喜馬拉雅在TTS技術領域的深耕,也帶動著音訊行業以語音合成技術為基礎的AIGC內容的產出,這將進一步豐富喜馬拉雅原有的UGC+PGC+PUGC的音訊生態,除真人主播外,AI主播的出現也讓喜馬拉雅創作者生態變得更加多元。

喜馬拉雅智慧語音實驗室盧恆表示,喜馬拉雅語音技術開發會將AIGC作為輔助工具,為喜馬拉雅平臺上的主播等內容創作者助力。AIGC的崛起,為內容創作注入了新的活力。

彩雲小夢AI續寫和喜馬拉雅AI演播的合作,展現了AIGC及AI技術賦能創作廣闊前景。未來,喜馬拉雅也將藉助科技的力量不斷開啟對於聲音的想象,讓AI技術為聲音賦能,讓聲音服務美好生活。(圖為喜馬拉雅提供,授權中國網財經使用)

推薦文章