【SDXL 1.0】写真画像ならRealistic Stock Photo

【SDXL 1.0】写真画像ならRealistic Stock Photo 画像生成

「日本人女性の実写画像を違和感なく生成したい」
「同じプロンプトでも偏りの少ない画像を生成したい」

このような場合には、Realistic Stock Photoがオススメです。
この記事では、Realistic Stock Photoについて解説しています。

本記事の内容

  • Realistic Stock Photoとは?
  • Realistic Stock Photoの利用方法
  • Realistic Stock Photoの動作確認

それでは、上記に沿って解説していきます。

Realistic Stock Photoとは?

Realistic Stock Photo - v2.0 | Stable Diffusion Checkpoint | Civitai
I trained a model and merge it a bit with version 1. I wanted to create a realistic skin texture without that typical glossy skin effect A good pro...

Realistic Stock Photoとは、、SDXL 1.0ベースのファインチューニングモデルです。
クローズアップ写真の画像生成が得意と説明されています。

確かに、クローズアップした写真が得意だとわかります。
デモ画像を見る限り、日本人も綺麗に表示してくれそうです。

あと、CFG Scaleに「3」が推奨されていることが特徴的と言えます。

CFG Scaleは、プロンプトの影響度を決める値です。
この値を大きくすれば、それだけプロンプトに沿って忠実に画像を生成しようとします。

逆に、この値が小さいとプロンプトからは自由になります。
自由になった分だけ、想定外の画像が生成される確率が増します。

CFG Scaleのデフォルトは「7」です。
そのため、「3」を推奨するというのはかなり珍しいことだと言えます。

以上、Realistic Stock Photoについて説明しました。
次は、Realistic Stock Photoの利用方法を説明します。

Realistic Stock Photoの利用方法

Realistic Stock Photoの利用方法を説明します。
この記事では、AUTOMATIC1111版web UIでの利用を前提とします。

ただし、web UIのバージョンには注意が必要です。

とりあえず、最新のweb UIをインストールすることをオススメします。

モデルは、Civitaiの公式ページからダウンロードします。
現時点では、次のバージョンが最新となっています。
(※その時点での最新をダウンロードすればよいでしょう)

「Download」ボタンをクリックすると、「realisticStockPhoto_v10.safetensors」をダウンロードできます。

ダウンロードしたファイルを指定のディレクトリ(models/Stable-diffusion)に設置します。
web UIの起動後、以下のようにcheckpointを選択できるようになっています。

また、VAEに関しては明記はされていません。
しかし、デモ画像のメタ情報を見るとVAEが用いられていることを確認できます。

メタ情報は、PNG Infoで簡単に見ることが可能です。

よって、VAEは利用した方がいいのでしょう。

以上、Realistic Stock Photoの利用方法を説明しました。
次は、Realistic Stock Photoの動作確認を説明します。

Realistic Stock Photoの動作確認

Realistic Stock Photoの動作確認を行います。

次のデモ画像を参考にしましょう。
https://civitai.com/images/2339895

サンプラーは、「DPM++ 3M SDE Karras」に変えています。
10枚生成した結果は、以下。

これらの画像は、選別していません。
初回で10枚生成した画像をそのまま載せています。

CFG Scaleが「3」であるためか、女性の顔が偏っていませんね。
また、手を綺麗に表示できるようです。

次は、日本人女性を生成してみましょう。
参考にするのは、以下。
https://civitai.com/images/2340015

同じように10枚生成した画像は、以下となります。

外国人と比べると、偏りが見られます。
それでも、他の実写系モデルと比べると偏りは小さい方と言えます。

ただ、着物ではなく、普通の姿をした日本人女性を見てみたいです。
プロンプトから着物要素を除去して生成した画像が、以下となります。

若干の偏りはありますが、かなり個性ある顔になっているのではないでしょうか。
特に1枚目なんて、なかなか味のがある顔だと感じます。

念のため、あと10枚生成しておきます。
サンプラーは、DPM++ 3M SDE Exponentialを利用します。

さらに偏りがなくなったように感じます。
まあ、たまたまかもしれませんけどね。

それでも、ここまで日本人を違和感なく描かけるモデルも珍しいです。
日本人特化のモデル以外で。

以上、Realistic Stock Photoの動作確認を説明しました。

タイトルとURLをコピーしました