「RVCでライセンスフリーのボイスモデルがあればいいのになぁ」
「RVCの音声変換を試してみたいけど、モデルの作成が面倒だ・・・」
このような場合には、この記事の内容が参考になります。
この記事では、RVC用のライセンスフリーのボイスモデルについて解説しています。
本記事の内容
- RVCのボイスモデル配布
- 無料配布ボイスモデルのダウンロード・設置
- 無料配布ボイスモデルの動作確認
それでは、上記に沿って解説していきます。
RVCのボイスモデル配布
RVCのボイスモデルにおいて、ファーストペンギンが現れました。
RVCのボイスモデルが、無料で配布されています。
もしかしたら、すでに同じような人がいるのかもしれませんが・・・
私がRVCのモデルで確認できたのは、この方が初めてです。
10人の女性の声をマージしてモデルが生成されているようです。
そのため、声から個人を特定することは難しいでしょう。
この発想であれば、男性版も作成できますね。
年代別モデルも作れそうです。
そして、ライセンスに関しては何でもOKとのこと。
音声合成・変換の分野でも、画像生成で生じたことが起こりそうですね。
音声モデル版Civitaiのようなサイトが、そのうち現れるのでしょう。
以上、RVCのボイスモデル配布について説明しました。
次は、無料配布ボイスモデルのダウンロード・設置を説明します。
無料配布ボイスモデルのダウンロード・設置
無料で手に入るモデルデータを取得します。
次の手順に沿って進めていきます。
- ボイスモデルのダウンロード
- ボイスモデルの設置
ボイスモデルのダウンロード
上記ページにアクセスします。
5種セットのzipファイルをダウンロードします。
ただし、ダウンロードにはpixiv IDが必要です。
ファイルをダウンロードできたら、zipファイルを解凍します。
ディレクトリを下に進んでいくと、pthファイルを5個確認できます。
ちなみに、「5種サンプルボイスと全体説明音声1種」ディレクトリの下にはサンプルの音声があります。
それぞれ各モデルを利用して、合成した音声となります。
ボイスモデルの設置
pthファイルの設置を行います。
その前提として、RVCのインストールは済ませておいてください。
「RVC-beta」の直下に「weghts」ディレクトリがあります。
デフォルトではこのディレクトリに、作成したモデルファイルが保存されます。
ここに先ほどのpthファイルを保存します。
設置できたら、RVCのweb UIを起動します。
すでに起動済みなら、「音源リストを更新する」ボタンをクリックします。
そうすると、次のように各モデルを選択できるようになっています。
以上、無料配布ボイスモデルのダウンロード・設置を説明しました。
次は、無料配布ボイスモデルの動作確認を説明します。
無料配布ボイスモデルの動作確認
無料配布ボイスモデルの動作確認を行います。
RVCの使い方は、次の記事で解説しています。
あと、変換する音声ファイルを用意する必要があります。
YouTubeから、適当にダウンロードするのもありです。
でも、音の品質が低いことが多々あります。
元の音声の質が悪いと、変換の精度を適切に判断できません。
そのため、ここは自ら音声ファイルを作ることも考えましょう。
と言っても、朗読するのは面倒です。
Pythonを使えば、サクッと音声合成が実現できます。
from gtts import gTTS s = '【拡散希望】RVC向け学習済みボイスモデルデータをMITライセンスで無料配布します。「愛想良い系少女の声5種風味パック」で5つのpthファイルです。10人の女性の声を元にマージ調整したオリジナルモデルとなります。どうぞよろしくお願いいたします。' tts = gTTS(s, lang='ja') tts.save('rvc_test.mp3')
上記のコードは、冒頭で紹介したツイートの内容を音声合成しています。
たった、これだけで次の音声ファイルが生成できます。
この音声を「処理対象」に設定して、次のような条件で変換していきます。
1ファイル毎に25秒前後です。
5ファイル全部を結合したのが、次の音声(動画)となります。
順番は、次の通りです。
- 愛想良い系少女の声(ほわっと風味ver) → AISO-HOWATTO.pth
- 愛想良い系少女の声(かっこいい風味ver) → AISO-KAKKOII.pth
- 愛想良い系少女の声(さらさら風味ver) → AISO-SARASARA.pth
- 愛想良い系少女の声(しっとり風味ver) → AISO-SITTORI.pth
- 愛想良い系少女の声(しゃきっと風味ver) → AISO-SYAKITTO.pth
正直、1から3は区別が付きません。
4と5は、明らかな違いを認識できます。
ピッチを調整すれば、もっと変わってくる可能性はあります。
是非とも、そのあたりを試してみてください。
以上、無料配布ボイスモデルの動作確認を説明しました。