Stable Diffusion XL(SDXL)による画像への文字入れ

Stable Diffusion XL(SDXL)による画像への文字入れ 画像生成

「Stable Diffusionを使って、画像へ文字を入れたい」
「SDXLを使って画像処理の生産性をUPしたい」

このような場合には、この記事の内容が参考になります。
この記事では、SDXLを用いた画像への文字入れについて解説しています。

本記事の内容

  • SDXLによるテキスト表現
  • SDXLを用いたテキスト表現の方法

それでは、上記に沿って解説していきます。

SDXLによるテキスト表現

Stable Diffusion XL(SDXL)を使って、高画質な画像が多く生成されています。
実際、SDXLを使えば簡単に次のような高画質画像を生成できます。

SD 1.5とは、別次元と言えます。
SDXLをゲームチェンジャーという人もいるようです。

でも、SDXLは高画質な画像を生成できるだけではありません。
実は、テキストを表現することもできます。

SDXLのAPIが公開された当時、テキストを表現する画像がTwitterに溢れました。
それまでのStable Diffusionでは、テキストを上手く表現することができませんでした。

そのような状況において、SDXLのテキスト表現技術は多くの注目を集めました。
私もその流れに乗って、API経由で以下の画像を生成しています。

しかし、SDXL 0.9が公開されて以降はどうでしょうか?
文字を入れている画像をあまり見かけません。

もしかして、SDXL 0.9では画像への文字入れができないのでしょうか?
私自身、このように思って検証したぐらいです。

検証した結果は、以下。

SDXL 0.9でも、問題なく画像に文字を入れることができています。
もしかしたら、画像への文字入れは単純に優先順位が低いだけかもしれません。

次のような画像を生成する方が、楽しいですからね。

それにしてもSDXLは、スゴイですよね。
これらは、公開されているプロンプトを適当に選んで生成した画像です。
処理にかかった時間は5分もかかっていません。

このような事情もあってか、SDXLによるテキスト表現についてはほとんど目にしません。

以上、SDXLによるテキスト表現について説明しました。
次は、SDXLを用いたテキスト表現の方法を説明します。

SDXLを用いたテキスト表現の方法

SDXLを用いたテキスト表現を行います。
SDXLは、Vladmandic版web UI(SD.Next)で動かす前提です。

まずは、「Free Coffee」の画像を生成してみましょう。

Poster on wall that says ‘Free Coffee’ inside minimalistic cofee shop, coffee machines, tables, chairs, high detail quality.

やはり、画質も以前(API利用時)よりもUPしていますね。
そして、表現の幅も広がっているように感じます。

まあ、何と言っても無料で自由に何枚でも生成できるのがいいですね。
API利用時は、残りのポイントを気にしながらの作業でした。

次は、ちょっと複雑なプロンプトを試しましょう。
と言っても、プロンプトはChatGPTに考えてもらいます。
(正確には、Photorealisticというプラグインです)

「No war」と書かれたプラカードをかかげたエイリアン

上記の内容をPhotorealisticにより、次のようなプロンプトとして出力します。

Capture a hyper-realistic, highly detailed image of an alien holding a placard that reads "No war". The alien is in the center of the frame, its eyes wide and expressive, its body language peaceful. The background is a starry night sky, providing a stark contrast to the white placard. The lighting is soft, with the glow from nearby stars and planets illuminating the scene.

このプロンプトで生成した結果は、以下。

最後は、文字を単体で表現してみます。

Capture a hyper-realistic, highly detailed image of the letter "A" formed by flames. The fire is bright and intense, the shape of the letter "A" clearly visible within the flames. The background is dark, making the fiery letter stand out even more.

「A」「B」「C」「D」とそれぞれを出力した結果が、以下。

頑張って調整すれば、オリジナルフォントの作成も可能になるのかもしれません。

以上、SDXLを用いたテキスト表現の方法を説明しました。

タイトルとURLをコピーしました