【RVC】無料で配布されているライセンスフリーのボイスモデル

「RVCでライセンスフリーのボイスモデルがあればいいのになぁ」
「RVCの音声変換を試してみたいけど、モデルの作成が面倒だ・・・」

このような場合には、この記事の内容が参考になります。
この記事では、RVC用のライセンスフリーのボイスモデルについて解説しています。

本記事の内容

RVCのボイスモデル配布
無料配布ボイスモデルのダウンロード・設置
無料配布ボイスモデルの動作確認

それでは、上記に沿って解説していきます。

RVCのボイスモデル配布

RVCのボイスモデルにおいて、ファーストペンギンが現れました。
RVCのボイスモデルが、無料で配布されています。

【拡散希望】RVC向け学習済みボイスモデルデータをMITライセンスで無料配布します。「愛想良い系少女の声5種風味パック」で5つのpthファイルです。10人の女性の声を元にマージ調整したオリジナルモデルとなります。どうぞよろしくお願いいたします。#RVC #VCClient https://t.co/t0uZW4daWX
— CHIHAYA ちはや (@chihaya_369) April 19, 2023

もしかしたら、すでに同じような人がいるのかもしれませんが・・・
私がRVCのモデルで確認できたのは、この方が初めてです。

10人の女性の声をマージしてモデルが生成されているようです。
そのため、声から個人を特定することは難しいでしょう。

この発想であれば、男性版も作成できますね。
年代別モデルも作れそうです。

そして、ライセンスに関しては何でもOKとのこと。

音声合成・変換の分野でも、画像生成で生じたことが起こりそうですね。
音声モデル版Civitaiのようなサイトが、そのうち現れるのでしょう。

以上、RVCのボイスモデル配布について説明しました。
次は、無料配布ボイスモデルのダウンロード・設置を説明します。

無料配布ボイスモデルのダウンロード・設置

無料で手に入るモデルデータを取得します。
次の手順に沿って進めていきます。

ボイスモデルのダウンロード
ボイスモデルの設置

ボイスモデルのダウンロード

【無料 / V2対応】RVC向け学習済みボイスモデルデータ「愛想良い系少女の声　5種風味パック」 - ちはや神社 - BOOTH

【無料 / V2対応】RVC向け学習済みボイスモデルデータ「愛想良い系少女の声　5種風味パック」このデータはRVC(Realtime Voice Changer)で使用できる学習済み(.pth)ボイスモデルデータです。笑顔で話すのと、サンプル長(CHUNK:サイズ)768(2000ms(2.0秒近く)にすると綺麗に...

上記ページにアクセスします。

5種セットのzipファイルをダウンロードします。
ただし、ダウンロードにはpixiv IDが必要です。

ファイルをダウンロードできたら、zipファイルを解凍します。
ディレクトリを下に進んでいくと、pthファイルを5個確認できます。

ちなみに、「5種サンプルボイスと全体説明音声1種」ディレクトリの下にはサンプルの音声があります。

それぞれ各モデルを利用して、合成した音声となります。

ボイスモデルの設置

pthファイルの設置を行います。
その前提として、RVCのインストールは済ませておいてください。

「RVC-beta」の直下に「weghts」ディレクトリがあります。
デフォルトではこのディレクトリに、作成したモデルファイルが保存されます。

ここに先ほどのpthファイルを保存します。

設置できたら、RVCのweb UIを起動します。
すでに起動済みなら、「音源リストを更新する」ボタンをクリックします。

そうすると、次のように各モデルを選択できるようになっています。

以上、無料配布ボイスモデルのダウンロード・設置を説明しました。
次は、無料配布ボイスモデルの動作確認を説明します。

無料配布ボイスモデルの動作確認

無料配布ボイスモデルの動作確認を行います。
RVCの使い方は、次の記事で解説しています。

あと、変換する音声ファイルを用意する必要があります。
YouTubeから、適当にダウンロードするのもありです。

でも、音の品質が低いことが多々あります。
元の音声の質が悪いと、変換の精度を適切に判断できません。

そのため、ここは自ら音声ファイルを作ることも考えましょう。
と言っても、朗読するのは面倒です。
Pythonを使えば、サクッと音声合成が実現できます。

from gtts import gTTS

s = '【拡散希望】RVC向け学習済みボイスモデルデータをMITライセンスで無料配布します。「愛想良い系少女の声5種風味パック」で5つのpthファイルです。10人の女性の声を元にマージ調整したオリジナルモデルとなります。どうぞよろしくお願いいたします。'
tts = gTTS(s, lang='ja')
tts.save('rvc_test.mp3')

上記のコードは、冒頭で紹介したツイートの内容を音声合成しています。
たった、これだけで次の音声ファイルが生成できます。

rvc_test.mp3