国产美女主播视频一区_国产精品蜜臀在线观看_亚洲成人动漫一区_亚洲视屏在线播放

首頁 > 房產

每日觀察!“AI 孫燕姿”爆火后,Meta 發布通用語音生成 AI:支持多種語音功能

來源:InfoQ 時間:2023-06-23 19:45:11

Meta 發布語音生成 AI 模型 Voicebox


(資料圖片)

近日,Meta AI 宣布在生成式 AI 語音模型領域取得了突破:開發出了首個可泛化至多種語音生成任務的模型 Voicebox,無需專門訓練即可達成頂尖性能表現。Meta AI 研究人員分享了多段音頻樣本和一篇研究論文,其中詳細介紹了他們采用的方法和取得的成果。

與圖像及文本類生成系統一樣,Voicebox 能夠創建多種樣式的輸出,包括從零開始創建輸出、修改給定樣本等。但與以往不同的是,Voicebox 并非簡單創建圖片或一段文字,而是直接生成高質量的音頻片段。該模型能夠為括英語、法語、西班牙語、德語、波蘭語和葡萄牙語在內的六種語言合成語音,同時執行噪聲去除、內容編輯、風格轉換和多樣化樣本生成等任務。

在 Voicebox 出現之前,生成式 AI 語音模型需要配合精心準備的訓練數據,就各項任務接受特定訓練。Voicebox 使用一種新的方法,可直接從原始音頻和隨附的轉錄結果中學習。與只能根據給定音頻片段續寫結尾的自回歸模型不同,Voicebox 能夠修改給定樣本中的任意部分。

據了解,Voicebox 能夠出色執行各種任務,具體包括:

結合上下文的文本到語音合成:使用長度僅為兩秒的輸入音頻樣本,Voicebox 即可匹配樣本的音頻風格并據此進行文本到語音生成。后續項目有望為無法說話的人士提供語音支持,或者為游戲 NPC 及虛擬助手快速生成對話語音。

跨語言風格轉換:給定一段語音樣本,外加一段英語、法語、德語、西班牙語、波蘭語或葡萄牙語的文本,Voicebox 即可生成對應的朗讀音頻。這種能力訟人興奮,未來可以幫助使用不同母語的人們通過自然且真實的方式開展交流。

語音降噪與編輯:Voicebox 的上下文學習為其賦予了強大的語音生成能力,可無縫編輯音頻中的片段。它能重新合成被暫時噪聲干擾的語音部分,或者替換掉說錯的詞,而無需重新錄制整段語音。用戶可以找到語音中被噪聲(如狗叫聲)干擾的原始片段,剪切出來并指示模型重新生成。有朝一日,這種能力還可用于清洗和編輯音頻,且使用過程與目前流行的圖像編輯工具一樣輕松便捷。

多樣化語音采樣:利用多樣化的真實數據完成學習后,Voicebox 將可生成與人們的現實對話高度吻合的以上六種語言對話音頻。未來,此功能可用于生成合成數據,協助提升語音助手模型的訓練效果。研究結果表明,基于 Voicebox 生成的合成語音訓練出的語音識別模型,在性能上幾乎與使用真實語音的模型相當,錯誤率降低了 1%;與以往同類文本到語音模型相比,合成語音數據訓練結果的錯誤率更是大幅降低 45%至 70%。

Voicebox 的誕生,標志著生成式 AI 研究又向前邁出了重要一步。在文本、圖像和視頻生成等方面,具備任務泛化能力的可擴展生成式 AI 模型已經激發了人們對于跨任務潛在應用的濃厚興趣。Meta AI 希望音頻領域未來也能掀起同樣的潮流,同時繼續保持深耕和探索,關注其他研究人員如何在 Voicebox 的基礎之上尋求新的突破。

Voicebox 背后的 Flow Matching 技術

現有語音合成工具的主要局限之一,在于只能就專門的任務配合準備好的數據接受訓練。這些單調而干凈的輸入數據相對有限且難以收集,因此也導致輸出結果變得同樣單調。

Meta AI 的研究人員基于“流匹配”(Flow Matching)技術構建了 Voicebox,這項技術是 Meta 在非自回歸生成模型領域的最新進展,能夠掌握文本到語音之間高度不確定的映射。非確定性映射非常重要,它使得 Voicebox 能夠從不同的語音數據中學習,且無需對各種變化要素做詳盡標注。也就是說,Voicebox 能夠在多樣性更強、規模更大的數據之上進行訓練。

與當前最先進的英語模型 VALL-E 相比,Voicebox 在可懂度(即單詞錯誤率,前者為 5.9%,Voicebox 為 1.9%)和音頻相似度(0.580 對 0.681)方面均更加強大,且速度要快 20 倍。在跨語言風格遷移方面,Voicebox 也優于領先模型 YourTTS,能夠將平均單詞錯誤率從 10.9%降低至 5.2%,并將音頻相似度從 0.335 提高至 0.481。

Voicebox取得新的先進結果,在單詞錯誤率方面優于Vall-E和YourTTS。

Voicebox還分別在英語和多語言基準測試中的音頻風格相似性方面,達成了新的頂尖成績。

研究人員使用超過 5 萬小時的語音錄音,和來自英語、法語、西班牙語、德語、波蘭語和葡萄牙語的公共有聲讀物轉錄對 Voicebox 進行訓練。經過訓練后,Voicebox 能夠在給定前后語音和片段轉錄數據時預測出語音片段。它還能學會根據上下文補全語音,從而被應用于其他語音生成任務,包括在無需重建整個輸入的前提下生成音頻的中間部分。

“AI 孫燕姿”爆火后,再看語音生成濫用風險

Voicebox 擁有眾多令人興奮的用例,但 Meta 也承認其存在潛在的濫用風險,所以 Meta AI 的研究人員決定暫不公開 Voicebox 模型或代碼。Meta 在社交平臺上公開表示:“與其他強大的人工智能創新技術一樣,我們認為這項技術也可能會被濫用,造成意外傷害。”

事實上,語音生成引發的濫用風險并不少見。以華語樂壇最近爆火的“AI 孫燕姿”為例,AI 讓孫燕姿翻紅的同時,也讓背后的風險顯露出來。一方面,AI 合成聲音可能涉及侵權問題,另一方面,也可能帶來一系列倫理和法律的風險。

我國《民法典》第 1023 條第二款規定,對自然人聲音的保護,參照適用肖像權保護的有關規定。第 1019 條第一款規定,任何組織或者個人不得以丑化、污損,或者利用信息技術手段偽造等方式侵害他人的肖像權。未經肖像權人同意,不得制作、使用、公開肖像權人的肖像。由此可見,比照對肖像的人格權保護,未經權利人的同意,也不得制作、使用、公開利用權利人的聲音。

此外,語音生成也會成為電信詐騙的利器。前段時間,美國和加拿大各地使用 AI 合成語音進行電信詐騙的案例多發,不少老年上當受騙。加拿大警方稱,最近加拿大各地都有不少類似案件發生,涉案金額已達數百萬加元。有受害者表示,犯罪分子使用的聲音和她兒子的聲音簡直一模一樣。在美國,類似的詐騙案件近期也呈上升趨勢。

作為首個能夠成功執行任務的多功能、高效泛化模型,Meta AI 堅信 Voicebox 即將開創生成式 AI 語音模型的新時代,但與其他強大的 AI 創新成果一樣,這項技術同樣可能因誤用引發意外危害。對于語音生成帶來的濫用風險,Meta 也想好了對策——構建一款高效分類器,用以區分由 Voicebox 生成的音頻和真實語音,借此緩解未來可能出現的種種風險。

在論文(https://research.facebook.com/publications/voicebox-text-guided-multilingual-universal-speech-generation-at-scale/)中,Meta AI 研究人員還具體講解了如何構建一款高效分類器,用以區分真實語音和 Voicebox 生成的音頻

參考鏈接:

https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

http://www.xinhuanet.com/ent/20230620/85f213fc8b914b7a9ea17addc3cec01e/c.html

本文轉載來源:

https://www.infoq.cn/news/YF1LRfH3Ttt7eZ0mBPjQ

相關稿件

每日觀察!“AI 孫燕姿”爆火后,Meta 發布通用語音生成 AI:支持多種語音功能

殊途·陰陽(關于殊途·陰陽介紹) 環球焦點

stainless是什么意思(stainless手表是什么牌子)

雙良節能中標錫林郭勒蘇能白音華電廠主機和輔機間接空冷島成套設備招標項目 中標金額1.36億-新要聞

取消住房限售等過時的限制政策勢在必行

青島打造首個勞動保障維權“綜合窗口”

世界聚焦:不吹不黑!這車比寶馬大眾強!

(財經·行情)倫敦股市22日下跌_速看料

ASML:建立全自主半導體產業鏈幾乎不可能!

11個曾經牛逼,現在早已被遺忘的“高科技”!看看你用過幾個

網線接口為什么是 RJ45 規格,而不能做成USB型? 環球熱消息

生活成本飆升 超過100萬名英國兒童接受食品救濟-環球微動態

天天觀熱點:馬斯克和扎克伯格“約架”,你看好誰?

別“甩鍋”電動車,禁摩限電不可取

2023年重慶養老金上調方案細則和重慶養老金調整最新消息(預估)_快資訊

一個家庭出現這些現象,說明在走下坡路了

“賽龍奪錦”端午民族音樂會,邀副中心居民共享文化大餐

印度或沒收小米48億,蔚來全系降價,成都招攬本科生

綠色賦能 “風”“光”迤邐——江蘇鹽城新能源產業發展一線見聞

好的婚姻,是“睡”出來!(好文)-天天微速訊

粽葉飄香,文化云祝您端午安康

環球快資訊:癡心的譚小環:兩次為愛退圈,老公風流,港姐冠軍淪落街頭賣魚蛋

全球速遞!長沙南站派出所執勤大隊長馮中偉:旅客平安就是他的最大心愿

廣汽集團(02238.HK):擬不參與如祺出行融資

出乎預料的發展? 陳小平: 人工智能正引發第一次重大社會實驗_環球消息

虛報工作成績,違規隨意執法……山東曝光4起基層治理典型問題-每日速遞

加拿大油罐車爆炸!巴黎學校爆炸大樓坍塌!傷29人,2人失聯!

第22屆明湖龍舟賽精彩瞬間

中央氣象臺發布今年首個高溫橙色預警 17站點最高氣溫破歷史極值

倒計時5天!天津夏季達沃斯,我們準備好了!


主站蜘蛛池模板: 国产在线观看精品一区二区三区| 国产h视频在线播放| 国产精品久久av| 亚洲国产欧美不卡在线观看 | 国产精品午夜av在线| 欧美日韩国产第一页| 国产精品美女视频网站| 久久精品久久久久| 日韩视频 中文字幕| 欧美一级片一区| 色综合久久天天综线观看 | 久久天天躁狠狠躁夜夜躁| 自拍日韩亚洲一区在线| 国产日韩视频在线播放| 久久av在线播放| 久久视频在线观看免费| 欧美日韩国产免费一区二区三区| 日韩中文在线中文网三级| 91精品国产91久久久久久吃药| 国产精品美女久久久久久免费| 国内精品久久久久伊人av| 国产在线视频91| 国产精品综合久久久| 日韩av在线综合| 国产婷婷一区二区三区| 国产综合免费视频| 国产亚洲欧美一区二区三区| 国产欧美日韩一区| 国产精品久久久久久久久免费 | 国产成人在线一区| 国产欧美日韩高清| 精品国产一区二区三区久久久狼| 国产日韩一区二区在线观看| 国产精品视频自在线| 国产日韩精品一区观看| 欧美亚洲一级片| 久久婷婷国产精品| 精品久久蜜桃| 国产美女网站在线观看| 国产一区二区精品免费| 国产精品情侣自拍|