【Flux】WebUI Forgeによる高速画像生成

【Flux】WebUI Forgeによる高速画像生成 画像生成

WebUI(Forge版)でFluxが動くようになりました。
それに6GB/8GBのGPUでも動くようになっています。

Fluxとは?

Fluxは、Black Forest Labsが開発した最先端のテキストから画像を生成するAIモデルです。
Fluxには、3つのバリエーションが存在しています。

  1. FLUX.1 [pro]: 最高性能モデル。商用利用向け。
  2. FLUX.1 [dev]: オープンウェイトモデル。非商用利用向け。
  3. FLUX.1 [schnell]: 高速モデル。個人利用向け。

FLUX.1 [dev]であっても、十分に高性能です。
どれくらい高性能かと言うと、次のベンチマークをご覧ください。

なんと、有料版のSD3-UltraよりもFLUX.1 [dev]の方が優れているのです。
ただ、FLUX.1 [dev]は個人のPCではまともに動きませんでした。

FLUX.1 [schnell]が、GPUメモリ24GBでなんとか動くというような感じです。
ローカル環境で試したところ、1枚の画像生成に144秒の時間がかかります。

正直、これでは使い物になりません。

そんな中、Forge版がFLUX.1 [dev]に対応しました。
かつ、低GPUでも動くといういうことです。

そのための工夫として、ForgeではBitsandBytesという技術が用いられています。
これは主に大規模言語モデル(LLM)で使用されている標準的な技術です。

Forgeの開発者(lllyasviel氏)によると、BitsandBytesを画像生成AIに適用したとのこと。
このことは、画像生成の分野では初めての事例になるということです。

そのおかげで、FLUX.1 [dev]をローカルマシンでも動かすことができるようになりました。

それまでは、FLUX.1 [schnell]ですら144秒かかっていいました。
それが、FLUX.1 [dev]を29秒で動かせるのです。

WebUI ForgeでFLUXを動かす

では、どうすればWebUI ForgeでFLUXを動かすことができるのでしょうか?
まずは、最新版Forgeをインストールしましょう。

アップデートするより、新規でインストールした方がトラブルは少ないと思います。
次に、モデルのダウンロードです。

モデルは、BitsandBytesで量子化されたモノをダウンロードする必要があります。
もちろん、lllyasviel氏がそれを用意してくれています。

NF4の方が、開発者によって推奨されています。
不思議なことにFP8よりもNF4の方が、精度が高いということです。

その辺りの説明は、lllyasviel氏自身が説明しています。

[Major Update] BitsandBytes Guidelines and Flux · lllyasviel/stable-diffusion-webui-forge · Discussion #981
(Before we start, Forge now supports UI presets like this. Click this GIF to zoom in.) (Again, before we start, to the best of my knowledge, I am the first one ...

ただし、NF4はCUDA 11.7以降のサポートが必要になります。
RTX 3XXX/4XXX GPUであれば、問題はないということです。

GTX 10XX/RTX 20XXのGPUの場合は、FP8をダウンロードすることになります。
この点には、注意が必要です。

あとは、利用する際の設定に注意することでしょうか。

このような設定にして、普通に画像生成を行えば問題はありません。

タイトルとURLをコピーしました