メルカリでの出品において、魅力的な商品写真は購入者の注意を引きます。
魅力的な商品写真は、より多くの視線を集め、結果として売り上げに直結します。
そんな商品画像をAIで作成しましょうということです。
以下は、メルカリの商品画像における規約になります。
- 実物の画像がない
- 転載画像のみの掲載
- 画質が粗いなどで商品の把握ができない
- その他、事務局が不適切と判断したもの
まず、ここにAIによる画像という記載はありません。
ただ、事務局がAI生成画像を不適切と判断したらアウトですけどね。
おそらく、それはないとは思います。
そもそも、技術的にそれは難しいと言えます。
とりあえず、「商品の状態」が判別できれば問題にはならないでしょう。
それでは、最初にメルカリに出品する商品の写真を撮ることからですね。
メルカリでは、画像サイズ「縦横比1:1」が推奨されています。
つまり、正方形ということです。
無線マウスを出品するために、このような写真を用意します。
ちなみに実際の画像サイズは、3024×3024です。
透過画像への変換
先ほどのマウスの写真を透過画像にする必要があります。
これもAIで一瞬です。
RMBG-1.4を使うと、次のように透過画像が作成できます。
(実際の画像サイズは3024×3024です)
もし削除できない部分が残ったら、そこは適当に消しましょう。
RMBG-1.4の場合、上手く行く確率がかなり高いです。
画像合成
画像合成は、LayerDiffusionを利用します。
LayerDiffusionについては、次の記事で説明しています。
そして、具体的には「From Foreground to Blending」というMethodを用います。
From Foreground to Blendingのについては、次の記事で解説しています。
プロンプトは、ここでは以下とします。
An overhead shot of a sophisticated black wireless mouse resting on a smooth wooden desk with a detailed and natural wood grain pattern. The desk surface is clear, with no other items, emphasizing the elegant simplicity of the mouse and the beauty of the woodwork. Soft ambient light enhances the warm tones of the wood and the sleek design of the mouse.
もちろん、ChatGPTに考えてもらいました。
このプロンプトを用いた結果、次のような画像が生成されます。
実際は、1024×1024のサイズで生成しています。
でも、何か違うんですよね。
「logi」の文字に違和感を感じます。
あと、マウスホイールも実物より汚れて見えてしまいます。
そこで、画像のサイズを2048×2048で生成してみます。
大きくすれば、綺麗に出力されるだろうという経験則です。
その結果は、以下となります。
「logi」が、実物と同じになっています。
ほぼ実物と同じです。
やはり、大きい画像で生成すれば綺麗に出力される法則は生きています。
ちなみに、2倍にアップスケールした場合はダメです。
あと、ステップ数を増やすことも効果はほとんどありません。
今のところは、画像サイズを大きくすることが最も効果のある対応と言えます。
最後に、様々な背景の商品画像を載せておきます。