Nebula XAI

Experience the future artificial intelligence

Myshell開源OpenVoice:即時的聲音克隆AI庫,簡短…

myshell開源開放式voice:即時的聲音克隆AI庫,該庫短…

Myshell具有開源的OpenVoice,這是一個語音封閉的AI庫,僅從一個簡短的音頻剪輯中迅速產生聽起來像人類的聲音。 OpenVoice於2021年12月推出,旨在為非技術用戶定制視頻,音頻,遊戲和其他創意項目的聲音。它可以使用Python代碼集成到其他軟件中。

OpenVoice的創建者認為,它有可能徹底改變人們與數字內容互動的方式。該公司在2月14日的博客文章中說:“文本到語音是使無法閱讀的人可以訪問文字的深刻突破。” “如果過去是關於閱讀的,未來將是關於聆聽的。OpenVoice將使創作者能夠將生活融入到以前從未像現在這樣的故事和數字角色。”

AI庫具有多種語音模型,用戶可以從中選擇,並支持13種語言和方言,包括英語(多個口音),西班牙語,中文,法語,德語,意大利語,日語,韓語,印地語,俄羅斯和葡萄牙語(兩個方言)。

OpenVoice可以生成三種不同類型的語音音頻:

*** tts(文本到語音):**將書面文本轉換為口語。
*** ss(語音綜合):**綜合語音說外語。
*** VC(語音克隆):**從用戶提供的簡短音頻剪輯中克隆語音。

OpenVoice的語音克隆通過將原始音頻波形轉換為MEL光譜圖,然後將其轉換為嵌入。

要使用OpenVoice,請通過PIP安裝庫或從Github克隆存儲庫。該庫還包括一個Python API,具有用於克隆和綜合語音的功能,更改語言率和音調以及使用內置聲音效果庫添加背景噪聲。

OpenVoice仍在開發中,Myshell鼓勵開發人員在Github上提交請求或問題,並加入其Discord Server進行討論。該公司致力於通過添加更多語音模型,語言和導出格式來維護圖書館並開發新功能。

Myshell是一家專門從事音頻和語音人工智能的軟件公司。它為音頻恢復和增強,語音克隆,文本到語音等提供服務。

See also  MIT技術評論2023年的10個突破性技術