SoreNutsからのお知らせ
新規記事
5/3に既存のプロンプトをローカルLLMを使って拡張【ComfyUI IF AI tools】を公開!
5/1にWildcardでプロンプトとLoRAのランダム化【ComfyUI】を公開!
更新記事
5/5に環境・背景・場所のプロンプト(呪文)一覧を更新!
5/3にカメラ・構図のプロンプト(呪文)一覧を更新!
5/1に服装のプロンプト(呪文)一覧を更新!
Stable Diffusion web uiで手軽に高品質なイラストを作りたい人向けにHires.fixという機能があります。Automatic1111(web ui)の初心者におすすめのテクニックになっています。
Hires.fixとは?
一言で言うなら、”高品質画像量産機能“ですね。
“Hires. fix“(High-Resolution Fix)は、低解像度で画像をレンダリング(生成)し、その後それを高解像度に拡大(アップスケール)するための便利なオプションです。
img2imgとの違いは?
img2imgは多様なオプションがあるので、仕上がりを細かく調整できます。
一方Hires.fixはオプションが少ないので、中程度の画像を量産したい人や手軽に高品質な画像を生成したい人向けの機能となっています。
Hires.fixの使い方
Hires.fixはtxt2img限定の機能でimg2imgで使うことはできません。
しかしimg2imgでもHire.fixと全く同じ画像を作ることができます。
要するにimg2imgの簡易版ということです。
Automatic1111のバージョンが1.6.0からHires.fixは折りたたみメニューに変わっています。
もし古いバージョンを使っている場合、特に理由が無ければアップデートしちゃいましょう。
使い方は非常にシンプルで
メニューを開いている場合は有効化されて、閉じている場合は無効化されます。
※上記のように開いていると有効化中
実際に高品質な画像を作ってみましょう。
Denoising strengthを0.55程度に設定して
Upscale byのスライダーを調整して、生成する解像度を決定しよう。
被写体の大きさにもよりますが1.5倍だと自然な絵が出やすいのでおすすめです。
また、Resize width toとResize height toから直接値を入力することもできます。
あとはメニューを開いた状態で生成しましょう。
次は設定の詳細を見ていきましょう。
Upscaler(アップスケーラー)とは?
アップスケーリングの手法を選べるドロップダウンメニューです。
このメニューには、”extras“タブで利用可能な全てのアップスケーラーが表示されます。
Latentというのは”latent space image”(潜在空間画像)という潜在空間を利用したアップスケーリングの手法です。
潜在空間について詳しく知りたい人向け
異なる潜在空間アップスケールモード
- Latent(通常の潜在空間アップスケーリング)
- Latent (antialiased)(アンチエイリアスが施された潜在空間アップスケーリング)
- Latent (bicubic)(バイキュービック法による潜在空間アップスケーリング)
- Latent (bicubic, antialiased)(バイキュービックとアンチエイリアスが組み合わされた潜在空間アップスケーリング)
- Latent (nearest)(最近傍法による潜在空間アップスケーリング)
- Latent (nearest-exact)(最近傍法を使って正確にアップスケールする方法)
誰でも理解できる”潜在空間画像”の説明
潜在空間画像を考えるとき、まず「パズルのピース」を思い浮かべてください。
想像してみてください。あなたが大きな風景のパズルを完成させようとしています。でも、このパズルは通常のものとは少し違います。このパズルには特別な小さなピース(魔法のピース)があり、これを正しい場所に置くだけで、その周りの大きなエリアのパズルがすぐに完成します。
この「魔法のピース」は、潜在空間画像のようなものです。この小さなピース(潜在空間画像)から、大きな画像の全体像や特徴を推測することができます。ちょうど、小さなヒントから大きな答えを導き出すようなものですね。
コンピュータやAIが画像を作るとき、最初はこの「魔法のピース」を使って基本的な形や色を考え出します。その後、それをもとに、詳細な画像を作成していきます。
だから、潜在空間画像は、画像を作るための魔法のヒントや小さな手がかりのようなものなんです。
潜在空間画像の利点は、小さな情報量で大きな画像の要素や特徴を効率的に表現・保存できることです。これにより、高速な処理やメモリの節約、そして複雑な画像生成や編集タスクを容易に行うことが可能となります。
Latent以外は通常のアップスケーリングの手法です。
種類が沢山ありますが、そこまで大きく変わらないので”Latent”と”Latent以外”という認識で大丈夫です。
筆者はSwinIR_4xをおすすめします。解像感が高くクリアな画像が生成できます。
しかしSwinIRは生成に2倍ほど時間が掛かるので、それ以外ならNoneやNearest、R-ESRGAN 4x+が無難でおすすめできます。
Hires Steps
Hires.fixは小さい画像を生成した後に、それを使って大きな画像を生成します。
Hires stepsは大きな画像を生成する時のSampling stepsを指定できます。
Sampling Stepsについて軽く解説
「Sampling Steps」とは、画像を生成する際に、ランダムなノイズから特定のテキストの指示に基づいて画像を形成するまでの工程の回数のことです。
このステップ数が多ければ多いほど、生成される画像は詳細になります。しかし、その分、画像を生成するのに時間がかかります。つまり、ディティールが細かい画像を得たい場合は時間をかける必要があり、逆に早く画像を得たい場合は少し粗い画像になります。
Hires stepsは基本的にデフォルトの20で十分です。
40や60に上げたからといって2倍、3倍と品質が上がるわけではありません。
Denoising strength
「Denoising strength」とは、画像のノイズを除去するための強度や効果の度合いを指すパラメーターです。
先ほどと同じようにHires.fixは小さい画像を生成した後に、それを使って大きな画像を生成します。
数値を上げるとノイズ除去の強度が増し、小さい画像からノイズが効果的に取り除かれます。
しかし、この値を高く設定しすぎると、大きな画像を生成するときにノイズだけでなく画像の詳細や特徴まで失われることになります。
目安
目安は0.6前後がおすすめです。
Hires.fixのデメリット
Hires.fixは便利な機能ですが、一枚に力を入れたい場合には向いていません。
また、生成される画像全てに高解像度処理を掛けるため、時間をかけて残念な画像を大量に生成します。
筆者のtips
もし一枚に力を入れたい場合はtxt2imgで小さい画像を大量に作り、その中から品質の高いものを選定し、img2imgでControlNet等を使い試行錯誤する手順があります。
筆者は現在全てのイラストをこの手順で作っています。おすすめです。
更に踏み込んだHires.fixの設定
プロンプトとサンプラー(Sampling method)をHires.fixと別々に設定することができます。
Settings→User Interfaceに
Hires fix: show hires checkpoint and sampler selection (requires Reload UI)
Hires fix: show hires prompt and negative prompt (requires Reload UI)
こちらにチェックを入れて
Apply settingsからReload UIで再起動をかけることで適用されます。
そうするとこのようにHires.fixに設定項目が追加されます。
Hires checkpointからモデルを選択でき、Hires sampling methodからサンプラーを設定できます。
また、テキストボックスの左がプロンプトで右がネガティブプロンプトになっています。
掲示板