AI画像生成の新星:OpenDalleがDALL-E 3のレベルを目指す

AI画像生成の新星:OpenDalleがDALL-E 3のレベルを目指す 画像生成

「DALLE-3のような画像を無料で生成したい」
「プロンプトに忠実な画像を生成するモデルを探している」

このような場合には、OpenDallegオススメです。
この記事では、OpenDalleについて解説しています。

本記事の内容

  • OpenDalleとは?
  • OpenDalleのダウンロード
  • OpenDalleの動作確認

それでは、上記に沿って解説していきます。

OpenDalleとは?

OpenDalleとは、SDXLベースのカスタムモデルです。
そのため、SDXLが動く環境ならどこでも動きます。

Diffusers用のモデルも公式から公開されています。
もちろん、web UIやComfyUIでも動きます。

個人的には、Fooocusで検証しています。

特徴としては、プロンプトの解釈に優れていることが挙げられています。
超高精細なイメージ生成よりも意味的な正確さに重点を置いているということです。

モデルのタイプとしては、マージモデルになります。

主には、以下のモデルをマージしているようです。

  • SDXL-DPO
  • SDXL MergeHeaven
  • AlbedoBase XL
  • Juggernaut XL(V7)

加えて、モデル開発者独自のモデルもマージしていると記載されています。
SDXL-DPOについては、以下が公式ページになります。

mhdang/dpo-sdxl-text2image-v1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

要するに、SDXL-DPOはSDXLを強化したモノということです。
プロンプトの忠実性を向上させる点において、SDXL-DPOは大きな要因なのでしょう。

OpenDalleのダウンロード

現時点(2023年12月28日)での最新バージョンは、OpenDalle 1.1となります。
ダウンロードは、以下のページから可能です。

dataautogpt3/OpenDalleV1.1 at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

上記ページにある、次のファイルをダウンロードします。

数日前まで、Civitai上でもページは存在していました。
https://civitai.com/models/238116/opendalle

しかし、今はページが削除されています。

また、復活するかもしれませんけどね。
なお、Civitaiのように404ページを独自ページにする方法は次のページで解説しています。

OpenDalleの動作確認

公式にあるデモ画像を何個か試してみましょう。
それぞれ以下のモデルで同じプロンプトにより画像を生成してみます。

  • Juggernaut XL(V7)
  • DreamShaper XL
  • blue_pencil-XL(V1.0.0)

左から上記のモデルで生成しています。
SEEDは、同じ値となります。

最も右の画像が、OpenDalleによるモノです。
OpenDalleの生成画像は、若干他とは毛色が違う印象を受けます。

次は、実写で確認してみましょう。
画像の並びは、上記と同じです。

実写は、どれも同じような感じです。
アニメモデルのblue_pencil-XLすらも。

最後は、アニメ画像で比較します。

アニメ画像では、Juggernaut XLとOpenDalleはかなり似ています。
まあ、OpenDalleはJuggernaut XLをマージしているため、当然と言えば当然です。

サンプルは少ないですが、OpenDalleは抽象的な画像に強いように感じます。
創造的な画像と表現した方がよいのかもしれません。

それは、結局プロンプトの解釈力につながりますね。
創造的・抽象的な画像を生成する場合に、OpenDalleは効果的かもしれません。

タイトルとURLをコピーしました