「画像からプロンプトを出力したい」
「NSFWコンテンツをプロンプトに変換したい」
このような場合には、この記事のFooocusのDescribeツールがオススメです。
この記事では、Describeについて解説しています。
本記事の内容
- Fooocus Describeとは?
- Fooocus Describeの利用方法
- Fooocus Describeの動作確認
それでは、上記に沿って解説していきます。
Fooocus Describeとは?
Fooocus Describeは、Midjourney Describeに似ているということです。
そして、同じような機能のCLIP Interrogatorよりも質は高いとのこと。
CLIP Interrogatorの場合は、単一の結果しか返しません。
それに対して、Fooocus Describeは複数の結果を返すことが可能です。
気に入ったプロンプトが出るまで粘ることができると言えます。
ただし、その機能は「Photograph」タイプの場合だけです。
![](https://self-development.info/wp-content/uploads/2023/12/image-27.png)
「Art/Anime」を選択した場合は、プロンプトは変更することはありません。
また、Fooocus DescribeはBLIPを画像解析エンジンに利用しているということです。
ローカル環境で動くFooocusにDescribeが搭載されたことは、非常に喜ばしいことです。
なぜなら、ChatGPTではNSFWなコンテンツは基本的にアップロードしたくありません。
アップロードしたところで、ほぼ確実に規制にひかかります。
そんなことで、アカウント停止なんて食らいたくありません。
そのため、NSFWな画像はなかなかプロンプトに変換しづらいところがあります。
しかし、今後はFooocus Describeで躊躇なくNSFWコンテンツもプロンプトに変換できます。
Fooocus Describeの利用方法
Fooocus Describeを利用するためには、Fooocusのバージョンを最新にしましょう。
2023年12月13日時点だと、2.1.831が最新となります。
バージョン2.1.831から、Fooocus Describeが利用可能です。
gitコマンドでFooocusをインストールしているなら、次のコマンドだけでOK。
git pull
このコマンドをリポジトリルートで実行するだけです。
gitコマンドを用いたFooocusのインストールは、次の記事で説明しています。
Fooocus Describeの動作確認
Fooocus Describeの動作確認を行います。
いつも通り、Fooocusを起動。
そして、「input image」をチェックします。
![](https://self-development.info/wp-content/uploads/2023/12/image-28.png)
「Describe」が増えていることを確認できます。
そして、「Describe」をクリック。
![](https://self-development.info/wp-content/uploads/2023/12/image-21.jpg)
画像をアプロードして、「Content Type」を選びます。
そして、「Describe this Image into Prompt」ボタンをクリック。
![](https://self-development.info/wp-content/uploads/2023/12/image-22.jpg)
そうすると、プロンプトの入力欄に変換されたプロンプトがセットされます。
「Content Type」が「Photograph」の場合は、処理を行う毎にプロンプトが変わります。
なお、この画像において「Art/Anime」で処理を行うと次のようなプロンプトが出力されます。
1girl, solo, breasts, looking at viewer, short hair, brown hair, black hair, dress, cleavage, brown eyes, jewelry, medium breasts, collarbone, upper body, earrings, sleeveless, dark skin, necklace, blurry, black dress, dark-skinned female, lips, depth of field, blurry background, realistic, nose, bokeh
「Art/Anime」の場合は、このプロンプトしか出力されません。
では、変換されたプロンプトを用いて画像を生成してみましょう。
利用するモデルは、同じモノを利用します。
パフォーマンスは、質よりもスピード重視とします。
![](https://self-development.info/wp-content/uploads/2023/12/image-29.png)
まずは、「Photograph」の場合の結果です。
![](https://self-development.info/wp-content/uploads/2023/12/image-23.jpg)
次は、「Art/Anime」の結果です。
![](https://self-development.info/wp-content/uploads/2023/12/image-24.jpg)
似てる似ていないの話であれば、「Art/Anime」が圧勝です。
まあ、出力されるプロンプトが断然長いモノとなっていますからね。
そして、品質に関しても「Art/Anime」はかなりハイレベルに見えます。
パフォーマンスを「Quality」にすれば、さらに品質はUPするはずです。
さすが、Fooocusと言ったところでしょうか。