【RVC】無料で配布されているライセンスフリーのボイスモデル

【RVC】無料で配布されているライセンスフリーのボイスモデル ツール

「RVCでライセンスフリーのボイスモデルがあればいいのになぁ」
「RVCの音声変換を試してみたいけど、モデルの作成が面倒だ・・・」

このような場合には、この記事の内容が参考になります。
この記事では、RVC用のライセンスフリーのボイスモデルについて解説しています。

本記事の内容

  • RVCのボイスモデル配布
  • 無料配布ボイスモデルのダウンロード・設置
  • 無料配布ボイスモデルの動作確認

それでは、上記に沿って解説していきます。

RVCのボイスモデル配布

RVCのボイスモデルにおいて、ファーストペンギンが現れました。
RVCのボイスモデルが、無料で配布されています。

もしかしたら、すでに同じような人がいるのかもしれませんが・・・
私がRVCのモデルで確認できたのは、この方が初めてです。

10人の女性の声をマージしてモデルが生成されているようです。
そのため、声から個人を特定することは難しいでしょう。

この発想であれば、男性版も作成できますね。
年代別モデルも作れそうです。

そして、ライセンスに関しては何でもOKとのこと。

音声合成・変換の分野でも、画像生成で生じたことが起こりそうですね。
音声モデル版Civitaiのようなサイトが、そのうち現れるのでしょう。

以上、RVCのボイスモデル配布について説明しました。
次は、無料配布ボイスモデルのダウンロード・設置を説明します。

無料配布ボイスモデルのダウンロード・設置

無料で手に入るモデルデータを取得します。
次の手順に沿って進めていきます。

  • ボイスモデルのダウンロード
  • ボイスモデルの設置

ボイスモデルのダウンロード

【無料 / V2対応】RVC向け学習済みボイスモデルデータ「愛想良い系少女の声 5種風味パック」 - ちはや神社 - BOOTH
【無料 / V2対応】RVC向け学習済みボイスモデルデータ「愛想良い系少女の声 5種風味パック」 このデータはRVC(Realtime Voice Changer)で使用できる学習済み(.pth)ボイスモデルデータです。 笑顔で話すのと、サンプル長(CHUNK:サイズ)768(2000ms(2.0秒近く)にすると綺麗に...

上記ページにアクセスします。

5種セットのzipファイルをダウンロードします。
ただし、ダウンロードにはpixiv IDが必要です。

ファイルをダウンロードできたら、zipファイルを解凍します。
ディレクトリを下に進んでいくと、pthファイルを5個確認できます。

ちなみに、「5種サンプルボイスと全体説明音声1種」ディレクトリの下にはサンプルの音声があります。

それぞれ各モデルを利用して、合成した音声となります。

ボイスモデルの設置

pthファイルの設置を行います。
その前提として、RVCのインストールは済ませておいてください。

「RVC-beta」の直下に「weghts」ディレクトリがあります。
デフォルトではこのディレクトリに、作成したモデルファイルが保存されます。

ここに先ほどのpthファイルを保存します。

設置できたら、RVCのweb UIを起動します。
すでに起動済みなら、「音源リストを更新する」ボタンをクリックします。

そうすると、次のように各モデルを選択できるようになっています。

以上、無料配布ボイスモデルのダウンロード・設置を説明しました。
次は、無料配布ボイスモデルの動作確認を説明します。

無料配布ボイスモデルの動作確認

無料配布ボイスモデルの動作確認を行います。
RVCの使い方は、次の記事で解説しています。

あと、変換する音声ファイルを用意する必要があります。
YouTubeから、適当にダウンロードするのもありです。

でも、音の品質が低いことが多々あります。
元の音声の質が悪いと、変換の精度を適切に判断できません。

そのため、ここは自ら音声ファイルを作ることも考えましょう。
と言っても、朗読するのは面倒です。
Pythonを使えば、サクッと音声合成が実現できます。

from gtts import gTTS

s = '【拡散希望】RVC向け学習済みボイスモデルデータをMITライセンスで無料配布します。「愛想良い系少女の声5種風味パック」で5つのpthファイルです。10人の女性の声を元にマージ調整したオリジナルモデルとなります。どうぞよろしくお願いいたします。'
tts = gTTS(s, lang='ja')
tts.save('rvc_test.mp3')

上記のコードは、冒頭で紹介したツイートの内容を音声合成しています。
たった、これだけで次の音声ファイルが生成できます。

rvc_test.mp3

この音声を「処理対象」に設定して、次のような条件で変換していきます。

1ファイル毎に25秒前後です。
5ファイル全部を結合したのが、次の音声(動画)となります。

RVC向け学習済みボイスモデルデータ「愛想良い系少女の声 5種風味パック」による音声

順番は、次の通りです。

  1. 愛想良い系少女の声(ほわっと風味ver) → AISO-HOWATTO.pth
  2. 愛想良い系少女の声(かっこいい風味ver) → AISO-KAKKOII.pth
  3. 愛想良い系少女の声(さらさら風味ver) → AISO-SARASARA.pth
  4. 愛想良い系少女の声(しっとり風味ver) → AISO-SITTORI.pth
  5. 愛想良い系少女の声(しゃきっと風味ver) → AISO-SYAKITTO.pth

正直、1から3は区別が付きません。
4と5は、明らかな違いを認識できます。

ピッチを調整すれば、もっと変わってくる可能性はあります。
是非とも、そのあたりを試してみてください。

以上、無料配布ボイスモデルの動作確認を説明しました。

タイトルとURLをコピーしました