「日本人女性の実写画像を違和感なく生成したい」
「同じプロンプトでも偏りの少ない画像を生成したい」
このような場合には、Realistic Stock Photoがオススメです。
この記事では、Realistic Stock Photoについて解説しています。
本記事の内容
- Realistic Stock Photoとは?
- Realistic Stock Photoの利用方法
- Realistic Stock Photoの動作確認
それでは、上記に沿って解説していきます。
Realistic Stock Photoとは?
![](https://self-development.info/wp-content/uploads/cocoon-resources/blog-card-cache/b8dc244902535e1ccd01ed9fdf14f0c8.jpeg)
Realistic Stock Photoとは、、SDXL 1.0ベースのファインチューニングモデルです。
クローズアップ写真の画像生成が得意と説明されています。
![](https://self-development.info/wp-content/uploads/2023/09/output_border_1000-4.jpg)
確かに、クローズアップした写真が得意だとわかります。
デモ画像を見る限り、日本人も綺麗に表示してくれそうです。
あと、CFG Scaleに「3」が推奨されていることが特徴的と言えます。
![](https://self-development.info/wp-content/uploads/2023/09/image-36.png)
CFG Scaleは、プロンプトの影響度を決める値です。
この値を大きくすれば、それだけプロンプトに沿って忠実に画像を生成しようとします。
逆に、この値が小さいとプロンプトからは自由になります。
自由になった分だけ、想定外の画像が生成される確率が増します。
CFG Scaleのデフォルトは「7」です。
そのため、「3」を推奨するというのはかなり珍しいことだと言えます。
以上、Realistic Stock Photoについて説明しました。
次は、Realistic Stock Photoの利用方法を説明します。
Realistic Stock Photoの利用方法
Realistic Stock Photoの利用方法を説明します。
この記事では、AUTOMATIC1111版web UIでの利用を前提とします。
ただし、web UIのバージョンには注意が必要です。
とりあえず、最新のweb UIをインストールすることをオススメします。
![](https://self-development.info/wp-content/uploads/2023/09/image-37.png)
モデルは、Civitaiの公式ページからダウンロードします。
現時点では、次のバージョンが最新となっています。
(※その時点での最新をダウンロードすればよいでしょう)
![](https://self-development.info/wp-content/uploads/2023/09/image-38.png)
「Download」ボタンをクリックすると、「realisticStockPhoto_v10.safetensors」をダウンロードできます。
ダウンロードしたファイルを指定のディレクトリ(models/Stable-diffusion)に設置します。
web UIの起動後、以下のようにcheckpointを選択できるようになっています。
![](https://self-development.info/wp-content/uploads/2023/09/image-39.png)
また、VAEに関しては明記はされていません。
しかし、デモ画像のメタ情報を見るとVAEが用いられていることを確認できます。
![](https://self-development.info/wp-content/uploads/2023/09/image-40.png)
メタ情報は、PNG Infoで簡単に見ることが可能です。
よって、VAEは利用した方がいいのでしょう。
以上、Realistic Stock Photoの利用方法を説明しました。
次は、Realistic Stock Photoの動作確認を説明します。
Realistic Stock Photoの動作確認
Realistic Stock Photoの動作確認を行います。
次のデモ画像を参考にしましょう。
https://civitai.com/images/2339895
サンプラーは、「DPM++ 3M SDE Karras」に変えています。
10枚生成した結果は、以下。
![](https://self-development.info/wp-content/uploads/2023/09/output_border_1000-5.jpg)
これらの画像は、選別していません。
初回で10枚生成した画像をそのまま載せています。
CFG Scaleが「3」であるためか、女性の顔が偏っていませんね。
また、手を綺麗に表示できるようです。
次は、日本人女性を生成してみましょう。
参考にするのは、以下。
https://civitai.com/images/2340015
同じように10枚生成した画像は、以下となります。
![](https://self-development.info/wp-content/uploads/2023/09/output_border_1000-6.jpg)
外国人と比べると、偏りが見られます。
それでも、他の実写系モデルと比べると偏りは小さい方と言えます。
ただ、着物ではなく、普通の姿をした日本人女性を見てみたいです。
プロンプトから着物要素を除去して生成した画像が、以下となります。
![](https://self-development.info/wp-content/uploads/2023/09/output_border_1000-7.jpg)
若干の偏りはありますが、かなり個性ある顔になっているのではないでしょうか。
特に1枚目なんて、なかなか味のがある顔だと感じます。
念のため、あと10枚生成しておきます。
サンプラーは、DPM++ 3M SDE Exponentialを利用します。
![](https://self-development.info/wp-content/uploads/2023/09/output_border_1000-8.jpg)
さらに偏りがなくなったように感じます。
まあ、たまたまかもしれませんけどね。
それでも、ここまで日本人を違和感なく描かけるモデルも珍しいです。
日本人特化のモデル以外で。
以上、Realistic Stock Photoの動作確認を説明しました。