「画像からプロンプトを出力したい」
「NSFWコンテンツをプロンプトに変換したい」
このような場合には、この記事のFooocusのDescribeツールがオススメです。
この記事では、Describeについて解説しています。
本記事の内容
- Fooocus Describeとは?
- Fooocus Describeの利用方法
- Fooocus Describeの動作確認
それでは、上記に沿って解説していきます。
Fooocus Describeとは?
Fooocus Describeは、Midjourney Describeに似ているということです。
そして、同じような機能のCLIP Interrogatorよりも質は高いとのこと。
CLIP Interrogatorの場合は、単一の結果しか返しません。
それに対して、Fooocus Describeは複数の結果を返すことが可能です。
気に入ったプロンプトが出るまで粘ることができると言えます。
ただし、その機能は「Photograph」タイプの場合だけです。

「Art/Anime」を選択した場合は、プロンプトは変更することはありません。
また、Fooocus DescribeはBLIPを画像解析エンジンに利用しているということです。
ローカル環境で動くFooocusにDescribeが搭載されたことは、非常に喜ばしいことです。
なぜなら、ChatGPTではNSFWなコンテンツは基本的にアップロードしたくありません。
アップロードしたところで、ほぼ確実に規制にひかかります。
そんなことで、アカウント停止なんて食らいたくありません。
そのため、NSFWな画像はなかなかプロンプトに変換しづらいところがあります。
しかし、今後はFooocus Describeで躊躇なくNSFWコンテンツもプロンプトに変換できます。
Fooocus Describeの利用方法
Fooocus Describeを利用するためには、Fooocusのバージョンを最新にしましょう。
2023年12月13日時点だと、2.1.831が最新となります。
バージョン2.1.831から、Fooocus Describeが利用可能です。
gitコマンドでFooocusをインストールしているなら、次のコマンドだけでOK。
git pull
このコマンドをリポジトリルートで実行するだけです。
gitコマンドを用いたFooocusのインストールは、次の記事で説明しています。
Fooocus Describeの動作確認
Fooocus Describeの動作確認を行います。
いつも通り、Fooocusを起動。
そして、「input image」をチェックします。

「Describe」が増えていることを確認できます。
そして、「Describe」をクリック。

画像をアプロードして、「Content Type」を選びます。
そして、「Describe this Image into Prompt」ボタンをクリック。

そうすると、プロンプトの入力欄に変換されたプロンプトがセットされます。
「Content Type」が「Photograph」の場合は、処理を行う毎にプロンプトが変わります。
なお、この画像において「Art/Anime」で処理を行うと次のようなプロンプトが出力されます。
1girl, solo, breasts, looking at viewer, short hair, brown hair, black hair, dress, cleavage, brown eyes, jewelry, medium breasts, collarbone, upper body, earrings, sleeveless, dark skin, necklace, blurry, black dress, dark-skinned female, lips, depth of field, blurry background, realistic, nose, bokeh
「Art/Anime」の場合は、このプロンプトしか出力されません。
では、変換されたプロンプトを用いて画像を生成してみましょう。
利用するモデルは、同じモノを利用します。
パフォーマンスは、質よりもスピード重視とします。

まずは、「Photograph」の場合の結果です。

次は、「Art/Anime」の結果です。

似てる似ていないの話であれば、「Art/Anime」が圧勝です。
まあ、出力されるプロンプトが断然長いモノとなっていますからね。
そして、品質に関しても「Art/Anime」はかなりハイレベルに見えます。
パフォーマンスを「Quality」にすれば、さらに品質はUPするはずです。
さすが、Fooocusと言ったところでしょうか。