【LoRA】文字表示を改善するBetterText.Redmond

画像生成

2023.09.20

「SDXL 1.0でも文字表示が上手くいかない・・・」
「画像内にテキストを読めるように表示したい」

このような場合には、BetterText.Redmondがオススメです。
この記事では、BetterText.Redmondについて解説しています。

本記事の内容

BetterText.Redmondとは？
BetterText.Redmondの利用方法
BetterText.Redmondの動作確認

それでは、上記に沿って解説していきます。

BetterText.Redmondとは？

BetterText.Redmond - Improving Text on SDXL Concept LORA - v1.0 | Stable Diffusion XL LoRA | Civitai

BetterText.Redmond is here! Introducing BetterText.Redmond, a concept Lora to improve SDXL for text! I'm grateful for the GPU time from Redmond.AI ...

BetterText.Redmondとは、SDXL 1.0用のLoRAです。
このLoRAを用いると、画像内における文字（テキスト）表示が改善できます。

ただし、決して完璧ではないとCivitai上の公式ページでは但し書きがあります。

あくまで、現状よりは改善するということですね。
それが、「BetterText.Redmond」と言う名前にも表れています。

Redmondとは、Redmond.AIから来ているようです。
Redmond.AIは、GPUを利用できるクラウドサービスになります。

おそらく、このLoRAの開発者の方はRedmond.AIの関係者（アフィリエイトを含む）の方だと思われます。
そうじゃないと、LoRAの名称に「Redmond」を入れませんよね。

また、そのLoRAが特徴のあるモノが多いです。
そして、質も高いように感じます。
実際、当ブログでも何度かRedmond系LoRAを取り上げています。

途中でRedmond.AIの紹介になりましたが、BetterText.Redmondに話を戻します。

BetterText.Redmondには、モデルとの相性があるようです。
複数のモデルを用いて試したところ、ある程度の規則性が見えてきました。

実写系のモデルとは、そこそこ相性が良いように感じます。
それに対して、アニメ系のモデルとは相性が悪いです。

と言うより、アニメ系モデルがそもそも文字表示に弱いのかもしれません。
したがって、アニメ系モデルにおけるBetterText.Redmondの利用はあまり期待しない方がベターです。

以上、BetterText.Redmondについて説明しました。
次は、BetterText.Redmondの利用方法を説明します。

BetterText.Redmondの利用方法

BetterText.Redmondの利用方法を説明します。
ここでは、AUTOMATIC1111版web UIの利用を前提に説明を行います。

ただし、SDXLを利用するにはweb UIのバージョンに注意が必要となります。
web UIでSDXLを利用する方法は、次の記事で説明しています。

さらには、SDXLでLoRAを利用するにはv1.5.1以降である必要があります。
とにかく、最新のweb UIをインストールしましょう。

では、Civitai上の公式ページからファイルをダウンロードします。

上記ボタンをクリックすると、「BetterTextRedmond.safetensors」というファイルをダウンロードできます。
現時点でのBetterText.Redmondのバージョンは、以下となります。
（※その時の最新バージョンをダウンロードしましょう）

ダウンロードしたファイルの設置場所は、「models\Lora」ディレクトリです。
LoRAの利用方法の詳細は、次の記事で説明しています。

ファイルを設置できたら、web UIを再起動します。（最も確実）
これでBetterText.Redmondが読み込まれたはずです。

BetterText.Redmondを利用するには、プロンプトに以下を追加します。

<lora:BetterTextRedmond:1>

デモ画像を見る限り、「1」以外の値は設定されていません。

以上、BetterText.Redmondの利用方法を説明しました。
次は、BetterText.Redmondの動作確認を説明します。

BetterText.Redmondの動作確認

BetterText.Redmondの動作確認を行います。
動作確認では、次の二つのモデルを用います。

SDXL1.0 BASE
Realistic Stock Photo

SDXL1.0 BASEは、Stability AIが公開したベースモデルと呼ばれているモノです。
Realistic Stock Photoは、次の記事で説明しています。

Realistic Stock Photoが、検証した中でも最もBetterText.Redmondと相性が良かったです。
最も文字表示が上手く行ったモデルになります。

それらのモデルを用いて、パターン毎に画像を生成しています。
プロンプトは、以下を利用。

A beautiful woman with a t-shirt write "Better Text" on it,

ネガティブプロンプトには「negativeXL_D」だけを入力しています。
negativeXL_Dは、ネガティブプロンプト用のEmbeddingです。

プロンプト以外の設定は、以下。

あとは、「CFG Scale」は「3」と「7」の2パターンを設定しています。
さらに、BetterText.Redmondを利用する場合と利用しない場合も考慮します。

よって、2(モデル数) x 2(CFG Scale数) x 2(LoRA利用状況数) = 8パターンを検証することになります。
以下に各パターン毎の生成画像を列挙していきます。

各モデル名の後にある【数字】は、「CFG Scale」の値となります。
もちろん、SEEDも同じモノを利用しています。

SDXL1.0 BASE【3】

SDXL1.0 BASE【3】 + BetterText.Redmond

SDXL1.0 BASE【7】

SDXL1.0 BASE【7】 + BetterText.Redmond

Realistic Stock Photo【3】

Realistic Stock Photo【3】 + BetterText.Redmond

Realistic Stock Photo【7】

Realistic Stock Photo【7】 + BetterText.Redmond

ということで、BetterText.Redmondの利用の際は「CFG Scale」に注意しましょう。
それに注意すれば、BetterText.Redmondは使えるLoRAです。

以上、BetterText.Redmondの動作確認を説明しました。

タイトルとURLをコピーしました