「絵本に出てくるような子供向けの画像をAIで生成したい」
「かわいい動物のイラストを作成したい」
このような場合には、COOLKIDSがオススメです。
この記事では、COOLKIDSについて解説しています。
本記事の内容
- COOLKIDSとは?
- COOLKIDSの利用方法
- COOLKIDSの動作確認
それでは、上記に沿って解説していきます。
COOLKIDSとは?
COOLKIDSとは、KIDS ILLUSTRATIONのLoRAになります。
正直、Civitaiにあるのが違和感ありまくりです。
Civitaiでこんな平和な光景を見たことがありません。

COOLKIDSを用いると、このような子ども向けのイラストを生成できるようになります。
COOLKIDSの開発者は、イラストや3Dの世界で長い経験があるようです。
そして、COOLKIDSの開発にあたってはルールを設けていると主張しています。
そのルールは、一人の作者からは一つの画像しか学習させないというルールになります。

学習に用いた画像は、全部で200枚ほどになるみたいです。

開発者のCOOLKIDSに対する熱意は、Redditのスレッドで確認できます。
https://www.reddit.com/r/StableDiffusion/comments/13enos5/working_on_v2_of_my_kids_illustration_lora_also/
上記スレッドでは、童話の作成に関しての会話があります。
ChatGPTとCOOLKIDSを用いて、子供向けの童話を作成したいという内容です。
ただ、その試みは失敗に終わっていると書かれています。
COOLKIDSでは、プロンプト毎にスタイルが大きく変わり、一貫性を保つことが難しいようです。
そのことについては、次のように指摘されています。

一貫性については、今後のバージョンアップに期待しましょう。
以上、COOLKIDSについて説明しました。
次は、COOLKIDSの利用方法を説明します。
COOLKIDSの利用方法
COOLKIDSの利用方法を説明します。
ここでは、AUTOMATIC1111版web UIの利用を前提に説明を行います。
まず、Civitai上の公式ページからファイルをダウンロードします。

上記ボタンをクリックすると、「COOLKIDS_MERGE_V2.5.safetensors」というファイルをダウンロードできます。
バージョンは、ダウンロード時期によって異なるでしょう。
ダウンロードしたファイルの設置場所は、「models\Lora」ディレクトリです。
LoRAの利用方法の詳細は、次の記事で説明しています。
ファイルを設置できたら、web UIを再起動します。
これでCOOLKIDSが読み込まれたはずです。
COOLKIDSを利用するには、プロンプトに以下を追加します。
ここは、ダウンロードしたファイル名に合わせてください。
<lora:COOLKIDS_MERGE_V2.5:1>
公式ページのデモ画像を見る限り、設定する値は「1」が標準のようです
以上、COOLKIDSの利用方法を説明しました。
次は、COOLKIDSの動作確認を説明します。
COOLKIDSの動作確認
COOLKIDSの動作確認を行います。
ただし、ここで一つ注意点があります。
利用するモデルは、次のモデルが推奨されているということです。

Realistic Vision V2.0については、次の記事で説明しています。
そして、Realistic Vision V2.0が推奨されている理由は以下になります。

簡単に言うと、他のモデルだとアニメのスタイルが踏襲されていることが理由になります。
つまり、他のアニメ要素はゼロにしたいということなのでしょう。
モデルに注意して、次のような条件で画像を生成してみましょう。

ただし、以下は無視しましょう。
ngtvH, ngtv, ngtvB
このようなNegative Embeddingがあるようです。
しかし、開発者曰く、無視してもOKとのこと。

その代わりに、ここでは以下を用います。
- EasyNegativeV2
- negative_hand-neg
EasyNegativeV2については、次の記事内で説明しています。
negative_handは、次の記事で取り上げています。
結果的には、次のようなネガティブプロンプトを用います。
EasyNegativeV2,negative_hand-neg
これらの条件で生成されるのが、次のような画像です。

平和な画像が作成されましたね。
では、他のモデルなら一体どうなるのでしょうか?
以下のモデルを試してみましょう。
- BRAV5
- Anything V5
- Counterfeit-V3.0
- DreamShaper
- Lyriel
- ReV Animated
モデル毎の結果は、以下。






やはり、アニメ系の要素があるモデルはアニメっぽい画像になります。
そして、そのモデルの特徴が出やすいです。
それに対して、アニメ要素ゼロのBRAV5はKIDS ILLUSTRATIONに最も近いです。
その次は、DreamShaperでしょうか。
いや、ReV AnimatedもKIDS ILLUSTRATIONだと言えそうです。
ちょっとクセがあるだけで。
是非とも、みなさんもこれ以外のモデルで試してみてください。
興味深い結果が出るかもしれません。
以上、COOLKIDSの動作確認を説明しました。