【ControlNet】1枚の画像でスタイル転送可能なReference-only

ツール

2023.05.16 2023.05.14

「コピーでもトレースでもなく、雰囲気の似た画像を生成したい」
「簡単に手っ取り早くいい感じの画像を生成したい」

このような場合には、ControlNetのReference-onlyがオススメです。
この記事では、ControlNetのReference-onlyについて解説しています。

本記事の内容

ControlNetのReference-onlyとは？
Reference-onlyの利用方法
Reference-onlyの動作確認

それでは、上記に沿って解説していきます。

ControlNetのReference-onlyとは？

ControlNetに新たにReference-onlyという技術が、実装されました。
web UIでも2023年5月13日から利用可能となっています。

Reference-onlyは、画像を「参照のみ」して画像生成を行います。
ざっくり言うと、スタイル転送を可能にしています。

それもたった1枚の画像によってです。
もっと言うと、1枚の画像だけでLoRAのようなことを実現しています。

具体的には、次のようなことが可能になります。

プロンプトには、次のように入力してReference-onlyを実行しています。

a dog running on grassland, best quality

結果を見ると、アップロードされた画像の犬をプロンプトで操作できています。
ただ、よく見ると完全に同じ犬ではありません。

そのことは、人を対象にするとよくわかります。
例えば、次のような画像をReference-onlyの対象にするとします。

この画像をもとに生成される画像は、次のようになります。

似てはいますが、同じ人とは言えません。
コピーではなく、あくまで「参照」ですからね。

ちなみに、参照元の画像はMidjourney v5.1で生成された画像です。
結果的に、Midjourney v5.1のスタイルをStable Diffusionに転送できています。

この検証に関しては、ControlNetの開発者自らが次のページで説明しています。
https://github.com/Mikubill/sd-webui-controlnet/discussions/1236#discussioncomment-5891498

このように、完コピではないところにReference-onlyの特徴があります。
コピーでもトレースでもなく、あくまで「参照のみ」を行っているのです。

以上、ControlNetのReference-onlyについて説明しました。
次は、Reference-onlyの利用方法を説明します。

Reference-onlyの利用方法

AUTOMATIC1111版web UIのインストールは、大前提です。

AUTOMATIC1111版web UIは、いつまでGoogle Colabで利用できるのでしょうか。
RedditやTwitterなどでは、無償版はもうまともに動かないという報告もあるようです。

そして、ControlNet のインストールも済ませておきましょう。

ControlNet がインストール済みであるなら、最新版にアップデートすることは必須です。
最新版であるならば、Preprocessorを確認します。

「reference_only」を確認できれば、OK。
なお、Reference-onlyにはモデルがありません。

通常は、PreprocessorとModelをペアで利用しますよね。

しかし、Reference-onlyの場合にはモデルの選択が不要となります。

「reference_only」を選択したら、Reference-onlyを利用できるようになりました。
まずは、「txt2img」タブを開きます。
そして、ControlNetを開いて、画像をアップロードしましょう。

追記 2023年5月16日
reference関連のPreprocessorに機能追加がありました。

設定は、下線の箇所だけでOK。
それ以外は、デフォルトで構いません。

あとは、普通に画像生成を行うだけです。
ただし、サンプラーは「Euler a」を利用します。

参考ページなどを見ると、どれも「Euler a」を利用しています。
他のサンプラーよりも、「Euler a」で生成される画像の方が画質も良いように感じます。
あくまで、個人の主観に過ぎませんけどね。

以上、Reference-onlyの利用方法を説明しました。
次は、Reference-onlyの動作確認を説明します。

Reference-onlyの動作確認

まずは、犬を走らせてみましょう。

モデルは、DreamShaperを利用します。

プロンプトは、以下を利用。

a dog running on grassland, best quality

結果は、以下。

次は、アニメ画像を対象にしてみましょう。

そして、プロンプトは指定しません。
スタイルだけ適用して、あとはお任せ状態です。

それに対して、ネガティブプロンプトは指定します。
崩れた画像は、見たくありませんので。
その際に利用するのは、次のNegative Embeddingとなります。

EasyNegativeV2
negative_hand-neg

EasyNegativeV2については、次の記事内で説明しています。

negative_handは、次の記事で解説しています。

モデルについては、以下を試してみましょう。

Anything V5
Hassaku
MeinaHentai
FaeTastic
CarDos Anime
BRAV5

それぞれの結果は、以下となります。

大体は、予想通りの結果となっています。
やはり、実写系モデルのBRAV5では厳しいようです

また、MeinaHentaiでは全体が暗くなっています。
他にも、このようなモデルが存在しています。

つまり、Reference-onlyにはモデルとの相性があるということです。
この辺は、実際に試して確かめるしかないでしょうね。

以上、Reference-onlyの動作確認を説明しました。

タイトルとURLをコピーしました