火山引擎首發(fā)“會(huì)表演”的有聲內(nèi)容創(chuàng)作平臺(tái)
2023-08-09 21:33:39 | 來源:互聯(lián)網(wǎng) |
2023-08-09 21:33:39 | 來源:互聯(lián)網(wǎng) |
近日,火山引擎正式推出有聲內(nèi)容創(chuàng)作平臺(tái)。該平臺(tái)歷經(jīng)2年研發(fā),相較傳統(tǒng)平臺(tái),其具備多情感演繹和自動(dòng)化預(yù)測(cè)兩大優(yōu)勢(shì)。
據(jù)了解,多情感演繹上,有聲內(nèi)容創(chuàng)作平臺(tái)的“聲音超市”不僅提供70余款適配不同題材的精品音色,還可通過豐富的情感實(shí)現(xiàn)更精彩的演繹;自動(dòng)化預(yù)測(cè)層面,平臺(tái)的AI自動(dòng)區(qū)分文本中的對(duì)話和旁白、識(shí)別對(duì)話的情感,整體合理率高達(dá)90%以上。
(資料圖片僅供參考)
目前,火山引擎也針對(duì)新用戶開展了5折限時(shí)特惠活動(dòng),感興趣的用戶可前往火山引擎官網(wǎng)獲取優(yōu)惠。
70余款精品音色,情感更豐富的聽覺體驗(yàn)
火山引擎的AI配音家族已擁有70余款精品音色,覆蓋各年齡段不同風(fēng)格的精品音色,可適配各類題材,滿足不同企業(yè)和用戶的有聲創(chuàng)作需求。
火山引擎精品“聲音超市”
“副語言”也稱“類語言”,是指伴隨話語出現(xiàn)的某些聲音現(xiàn)象,例如停頓、重音、語速、語調(diào)等,以及言語的功能性發(fā)聲,例如笑聲、哭腔、咳嗽等。在有聲內(nèi)容創(chuàng)作過程中,僅有音色數(shù)量上的積累并不夠,為了讓AI主播像專業(yè)配音演員一樣演繹出更深層次的“人類情感”,火山引擎為AI音色賦予了多樣的聲音情緒和“副語言”。
自動(dòng)化預(yù)測(cè)工具,為業(yè)務(wù)降本增效
在精品AI有聲內(nèi)容制作中,需要人工對(duì)文本進(jìn)行標(biāo)注制作,尤其是長(zhǎng)文本中,需要區(qū)分人物角色的臺(tái)詞以及對(duì)應(yīng)情感。這一過程耗時(shí)耗力,是造成精品AI有聲內(nèi)容很難大規(guī)模批量生產(chǎn)的原因。
針對(duì)這一痛點(diǎn),火山引擎自研「AI 文本理解」模型 ,自動(dòng)預(yù)測(cè)人物和情感,包括提取文本中對(duì)話人物、自動(dòng)判定情感等能力。
在整體聽感與純?nèi)斯?biāo)注的效果齊平的前提下,AI文本理解模型可以解放大部分的標(biāo)注人力,大幅縮減標(biāo)注的時(shí)間和成本,為企業(yè)降本增效。
「AI 文本理解」模型
在火山引擎「AI有聲內(nèi)容創(chuàng)作平臺(tái)」中,
● 用戶只需將目標(biāo)文本導(dǎo)入,由平臺(tái)自動(dòng)完成人物的抽取、并判定對(duì)話所屬的人物和情感;
● 在配音環(huán)節(jié),用戶可以自主選擇配置AI音色來匹配人物,也可選擇簡(jiǎn)單標(biāo)定角色人設(shè),依據(jù)平臺(tái)內(nèi)置策略一鍵配音;
● 配音完成后,平臺(tái)會(huì)根據(jù)自動(dòng)預(yù)測(cè)的信息完成音頻的自動(dòng)合成和拼接。
AI有聲內(nèi)容創(chuàng)作平臺(tái)
未來,火山引擎會(huì)持續(xù)投入有聲內(nèi)容創(chuàng)作平臺(tái)的建設(shè)與創(chuàng)新,在底層技術(shù)和實(shí)際應(yīng)用層面不斷探索從“文本”到“有聲作品”全流程的一體化智能創(chuàng)作方式,為用戶打造更好的使用體驗(yàn)。