Stable Diffusion
前回、Stable DiffusionでRefinerをいじってみました。

今回はBatch countとBatch sizeをいじっていきます。
Batch countとは同じプロンプト、同じパラメータで指定した数の枚数を連続して生成します。
またBatch sizeも同じプロンプト、同じパラメータの画像を指定した数だけ出力しますが、こちらは処理が並列で行われます。
並列で行う分、処理の負担は増えますが、生成までの時間は短くなる傾向にあるようです。
それぞれWeb UIではここにあります。

今回、プロンプトとしてはこんな感じのプロンプトを用意してみました。
1boy, 7 years old, black hair, very short hair, red robe, purple eyes, leather armor, holding sword on right hand, holding shield on left arm, fighting pose, looking at viewer, front of castle, extremely detailed
7歳の男の子で、髪の毛は黒で短髪、赤いマントを羽織っていて、目は紫、革の鎧を着て、右手に剣を、左手に盾を持って、ファイティングポーズをとりつつ、視線はこちらを向いていて、お城の前にいる、とても高画質な画像 と言った感じです。
基本的なパラメータはこんな感じにしました。
Sampling method: DPM++ 2M SDE
Schedule type: Karras
Sampling steps: 30
Width: 512
Height: 512
Upscaler: Latent
Hires step: 0
Denoising strength: 0.7
Upscale by: 2
それでは始めていきましょう。
Batch count
まずはBatch countで、とりあえず3にして画像を生成してみました。

こんな感じで3枚の少しずつ異なった画像を連続して生成してくれます。
ちなみに連結した画像はプレビューでみることができますが、保存されるのは3枚バラバラの画像ですので、連結してあるものが欲しい場合はプレビューでの保存をお忘れなく。
全ての画像を生成し終わるまでに5分33秒かかりました。
Batch size
Batch sizeを3にして画像を生成してみました。

こちらの生成では5分30秒かかりました。
私の環境ではそこまで並列処理の効果は得られなかったようですが、パワフルなPCをお持ちの方は試してみてもいいかと思います。
ちなみになんでこんな機能があるのかなと思ったのですが、画像生成AIでは今回試してみたように、同じプロンプト、同じパラメータでも違った画像を出力してくれます。
つまりそこにランダムな要素があるということで、良いものを得るには何度も画像を生成して、その中から選ぶというのが一つの戦略となっています。
ということで何枚も一度に生成する機能が付いているというわけです。
次回はStable Diffusionで画像から画像を生成するimg2imgを試してみます。
ではでは今回はこんな感じで。
コメント