「プロンプトを工夫しても限界がある・・・」
「LoRAの数にも限界がある・・・」
このような場合には、この記事の内容が参考になります。
この記事では、AI美女生成の最終兵器について解説しています。
本記事の内容
- AI美女生成の最終兵器とは?
- LoRA・プロンプトを超えた方法
- 動作確認
それでは、上記に沿って解説していきます。
AI美女生成の最終兵器とは?
AI美女を生成するのは、簡単です。
例えば、fuduki_mix(V1.5)をモデルに利用するとします。
デモ画像のプロンプトを利用すれば、次のようなAI美女を出力できます。
日本人の美女であれば、SDXL版でfuduki_mixがトップレベルです。
ただ、BRAシリーズのSDXL版が出てくれば、この辺の勢力図は変わってくるとは思います。
いずれにせよ、現状のモデルは感心するレベルで美女を生成します。
しかし、そこには大きな問題が存在しています。
大きな問題とは、量産型の顔問題です。
これは、モデルに限界がある以上は避けられない問題になります。
そんな中で、なるべく量産型の顔にならないように対策を行う訳です。
プロンプトを工夫したり、LoRAの使用で量産型の顔にならないように対策します。
その対策により、量産型の顔問題をある程度はクリアできます。
それでも、同じような顔を生成している人を見かけることはなくならないでしょう。
あくまで、確率が下がるだけですからね。
自製LoRAがあるとかなら、話は変わってきます。
でも、自製LoRAを何個も所有することは普通は難しいです。
それなら、LoRAのような効果を出せる機能を利用しましょう。
すでに、みなさんはその機能を利用したこともあるかもしれません。
その機能を利用する方法が、AI美女生成の最終兵器となります。
以上、AI美女生成の最終兵器について説明しました。
次は、LoRA・プロンプトを超えた方法を説明します。
LoRA・プロンプトを超えた方法
AI美女生成の最終兵器に名前を付けるなら、「LoRA・プロンプトを超えた方法」となります。
LoRA・プロンプトを超えた方法は、新しいモノではありません。
その方法とは、ControlNetにおけるPreprocessorの一つであるReferenceのことです。
Referenceを用いれば、量産型の顔問題を解決できます。
結果的には、個性あるAI美女を生成することも可能になります。
これって、実はモデルの限界を超えているということなんですよね。
モデルの限界を超えるということについて説明しておきます。
例えば、Juggernaut XLという人気モデルがあります。
凄く良いモデルですが、日本人の表現はイマイチです。
a close up photo of a 20 year old Japanese woman in a blouse at a bar, seductive smile,cinematic light, film still,
上記プロンプトで生成した結果は、以下となります。
と言っても、これは「Japanese」の影響度が大きいことが原因となります。
CFG Scaleを「7」から「1.5」に下げた場合の結果は、以下。
いかにもという日本人顔からは、マシになりました。
「Japanese」の影響度が下がったためでしょう。
でも、これが良い感じとは言えないのですよね。
それに対して、次の画像を見てください。
どうでしょうか?
かなり日本人として表現できていると思いませんか?
すべてとは言いませんが、中には女優レベルのAI美女がいます。
それもそのはずで、実在する女優の画像をReferenceで用いています。
Referenceを利用することにより、Juggernaut XLの限界を突破できているのです。
Juggernaut XLの性能を活かしつつ、日本人対応ができていると言えます。
以上、LoRA・プロンプトを超えた方法を説明しました。
動作確認
冒頭でfuduki_mixを用いて生成した画像を載せています。
その際に用いたプロンプトは、以下となります。
プロンプト
a close up photo of japanese woman in luxury apartment, cute, (high resolution detail of human skin texture:1.4,rough skin:1.2), (brown eyes), (smile:0.7),(portrait:1.8), (white shirt and midi skirt), (indirect lighting), Window light,
ネガティブプロンプト
illustration, 3d, 2d, painting, cartoons, sketch, watercolor
プロンプトは同じモノをそのまま利用します。
設定も基本的には、同じ設定とします。
ただし、CFG Scaleを「5」から「2.5」に下げています。
ここでは、「japanese」の影響度を下げるという意図ではありません。
どちらかと言うと、プロンプト自体の影響度を下げることを意図しています。
そして、相対的にReferenceの効果を強めたいということです。
そのReferenceの設定は、以下。
画像は、人気女優の画像を用います。
fuduki_mixをモデルに用いて上記設定で生成したのが、以下となります。
Juggernaut XLの結果で示した画像と同じ2人の女優の画像を用いています。
fuduki_mixの結果は、もちろん綺麗ですね。
そもそも、fuduki_mix自体が綺麗な日本人女性の画像を生成しますからね。
それに加えて、女優の美しさが加わっているということになります。
実は、Referenceにはさらなる機能が備わっています。
画像を混合できるのです。
つまり、2人の女優を融合させることができるということです。
その結果が、以下。
融合すると、AI成分が薄れるような気がします。
折角なので、Juggernaut XLでも融合しておきましょう。
こちらもAI顔からは、かなり離れたのではないでしょうか。
融合することにより、モデルの限界だけではなく、AIの限界も突破できそうです。
以上、動作確認を説明しました。