【Stable Diffusion】Anything v3.0とF222モデルの結合

【Stable Diffusion】Anything v3.0とF222モデルの結合 機械学習

「Stable Diffusionで綺麗に女性を描画できるモデルを探している」
「Anything v3.0とF222モデルを結合したモデルの効果は?」

このような場合には、この記事の内容が参考になります。
この記事では、Anything v3.0とF222モデルを結合した効果について解説しています。

本記事の内容

  • Anything v3.0とF222モデルの結合
  • 結合したモデルの検証結果
  • Anything v3.0とF222モデルの結合に関するまとめ

それでは、上記に沿って解説していきます。

Anything v3.0とF222モデルの結合

Stable Diffusionでは、多くのモデルが公開されています。
そして、それらを結合して新たなモデルを作成することが可能です。

モデルを結合する方法は、次の記事で解説しています。

そして、最近RedditでAnything v3.0とF222について目にすることがありました。

これは、Anything v3.0とF222モデルを結合してオウムの綺麗な画像を生成できたというスレッドです。
確かに、スレッドに書かれている条件で綺麗なオウムの画像を生成できました。

他にも、何か所でAnything v3.0とF222の結合に言及しているコメントがありました。

今、Anything v3.0とF222の結合モデルがちょっとしたブームになっているようです。
ブームと言っても、すごく限定的ですけどね。

F222モデルと言えば、人体(特に女性)の描画を得意としています。

また、Anything v3.0はアニメの描画に強いモデルになります。
そして、これらのモデルを結合すると女性の描画を正確にできると言われています。

なぜか動物も綺麗に描けるようになるということです。

以上、Anything v3.0とF222モデルの結合について説明しました。
次は、結合したモデルの検証結果を説明します。

結合したモデルの検証結果

Anything v3.0とF222モデルは、比率を変えて結合しました。
全部で7パターンの結合モデルを作成しています。

パターンAnything v3.0F222
1100%0%
295%5%
375%25%
450%50%
525%75%
65%95%
70%100%

これらのモデルを使って、画像を生成していきましょう。
どうせなら、できる限り速く、綺麗に画像を生成したいです。

処理の高速化は、サンプラーにDPM-Solverを用います。
ステップ数は、1画像当たりに「40」を設定します。

そして、VAEを利用して画質を上げます。
「stabilityai/sd-vae-ft-mse」を利用して、少しでも画質を上げていきます。

では、結果を確認してきましょう。
画像は、左からパターン順に並べています。

つまり、アニメから実写に変化していくことになります。
もちろん、seedは同じ値で検証しています。

固有名詞

hatsune miku

Emma Watson

一般名詞

girl

dog

細かく指定したプロンプト

(((masterpiece))), highly detailed photography, spring, portrait of beautiful woman standing in the town, perfect face, perfect body, slightly thin skin, ((sharp focus)), photo by Annie Leibovitz, intricate, natural lighting, high quality, 4k, cover photo

以上、結合したモデルの検証結果を説明しました。
次は、Anything v3.0とF222モデルの結合に関するまとめを説明します。

Anything v3.0とF222モデルの結合に関するまとめ

結果を見てどうでしょうか?
ある程度の規則性のようなモノが、存在するようには思えます。

ただ、どのパターンがいいとは言えません。
画像によっては、ベストなパターンは異なります。
何より、主観によるところが大きいので正解なんてありません。

例えば、「Ariana Grande」で生成した画像がそのようなケースになります。

パターン4とパターン5で甲乙付け難いです。

ただ、今回の検証を通じて一つの結論は出ました。
その結論とは、複数のモデルで画像を生成するということです。

7つのモデルで画像を生成しても、それほど時間はかかっていません。

トータルで50秒程度で7枚の画像を生成できています。
もちろん、マシンスペックによってはこの時間は変わってきます。

7つではなく、3つ程度のモデルに絞り込んでもよいでしょう。
絞り込むなら、パターン3・4・5にするかもしれません。

とにかく、一つのモデルで神頼みするようなことはやめましょうということです。

以上、Anything v3.0とF222モデルの結合に関するまとめを説明しました。

タイトルとURLをコピーしました