これからStable Diffusionを始める人に知ってほしいこと


Stable Diffusion(ステーブル・ディフュージョン)をこれから始める人に知っておいてほしいことをまとめます。Stable Diffusionを始めてみてわかったことを忘備録として残しておきます。今からAIを使ってイラスト画像を生成したいという人におすすめの内容です。
Image Credit: Ourt

{tocify} $title={Table of Contents}
Ads
30日間無料|プロの声優や俳優の朗読が楽しめる+12万冊以上の対象作品が聴き放題になる【Amazon Audible】



Stable Diffusionを始めてわかった5つのこと


Stable Diffusionを始めてわかったことや最初に知っておきたかったことをまとめます。画像生成AIの世界はアップデートが早いのでここに書いた情報はすぐに古くなる可能性があります。※2023年4月時点


Nvidia以外はGoogleコラボにしとけ


Stable DiffusionはNvidia製のグラフィックボード向けに作られているので、自身のPCがAMD製グラボの場合はGoogleコラボ(正式名称:Colaboratory)を利用した方が早いです。


Googleコラボを使うことで高性能なPCでなくともStable Diffusionを簡単に導入できます{alertInfo}


いわゆるGoogleの高性能なサーバーを利用してクラウド上でStable Diffusionを扱えるようになるのでスペックの高いPCが不要になるわけです。

"クラウドではなくローカル環境の方がいい"といったことをネットで見たのですが、私はAMD Radeonユーザーなのでエラーが出まくって大変でした。

英語で検索しながらエラーの要因を突き止めて解決しても、次々と新たなエラーを吐くのでキリがなかったです。5時間戦っても無理だったので諦めてGoogleコラボで始めたら30分で導入できて唖然でした。

かなり消耗したので最初からGoogleコラボでやるんだった、、



モデルとは画風のこと


Stable Diffusionなどの画像生成AIにはモデルと言うのがあり、それはいわゆる画風を決める拡張機能のようなものです。どのモデルを使うかによって、イラストの雰囲気や人物の顔が大きく変わるんです。


waifuのサンプル画像


そして、多くのサイトで推奨されているのが「waifu」というモデルです。スタンダードなアニメの美少女を生成したいときに使えます。おそらく最も人気なモデルの1つです。

基本的にwaifuのような主要なモデルは上記のリンク先であるHuggingFaceというサイトからダウンロードします。"Open in Colab"ボタンからすぐにGoogleコラボに取り入れられるからです。



呪文には書き方がある


画像生成AIでは呪文の書き方が重要なのは知られてると思いますが、それなりに出来栄えの良い画像を生成するには書き方があるんです。

例えば、ourt AI Diffusionモデルによって生成された以下の美少女イラストを見てください。


via@ourt


この高品質な画像の呪文は以下の通りです。ちなみにネガティブプロントとは除外したい呪文を意味します。


プロンプト:
((masterpiece, best quality)),Fearless ,innocent smile,vampire,girl,wept bangs,inverted bob,sidelocks,Maroon hair, two-tone hair,red inner color,a black dress,look down,long skirt,{codeBox}

ネガティブプロンプト:
(worst quality:1.4), (low quality:1.4) , (monochrome:1.1),shed tears,bad fingers,{codeBox}


このように特に重視したいキーワードは((サンプル))で囲います。もし重要なキーワードが複数ある場合は((((サンプル))))のように()を増やして囲むんです。

逆に、あまり重要ではないキーワードは[[サンプル]]で囲みます。一応呪文に含めたけどさほど重視しない場合に使います。

最初の内は呪文の書き方が全く分からなかったので、適当な呪文でa very beautiful girl with long black hairと、ネガティブにはmessy,blurryと自己流に書いてたんですが、それだと全然きれいな画像にはならなかったです。

ちなみに、呪文投稿サイトはアワートが最もおすすめです。ここで呪文の書き方が学べます。


参考記事:
【AIアート】呪文生成のノウハウ【Stable Diffusion web UI(AUTOMATIC1111版) / プロンプト / ネガティブプロンプト】




画像サイズは変更しちゃダメ


Stable Diffusion WebUI


Stable DiffusionではUIを見てもわかる通り、画像サイズを変更できる仕様なのに実際に画像サイズを大きく設定すると描画が大きく崩れます。なぜこうなるかは不明です。

なので画像サイズはデフォルト(512×512px)のまま変えず、もし大きくしたいならHires.fixといった拡張機能を使う必要があります。初期値のサイズより大きくして生成すると絵が激しく壊れます。


参考記事:
【Stable Diffusion】Hires.fixで解像度を上げて高画質化する方法



解像度が指定できない


これは結構大きなデメリットだと思います。画像サイズを大きくすることは拡張機能を使えば可能であることは先述しました。

だけど、解像度を指定することは現状出来ないみたいですね。なのでStable Diffusionで生成した素敵なイラストを印刷して自室に飾るといったことが出来ないです。

印刷するには解像度300~350DPIのJPGでダウンロードしないと綺麗に印刷できないからです。



最後に|使いこなすまでは大変


以上、これからStable Diffusionを始める人に知ってほしいことをまとめました。

画像生成AIは使いこなすまでが大変です。もし、Stable Diffusionを扱う自信がないという場合はPhotoshopのAIによる画像生成機能が簡単なのでおすすめです。

テキストを入力して水彩画、フィルム調、ネオン、色鉛筆、レトロなどのイメージスタイルをオプションで選択するだけでおしゃれなアートを作ってくれます。Stable Diffusionを始める前の肩慣らしとしては優秀です。


参考記事:
AIを活用した最新機能Adobe Fireflyが登場


最後までお読みいただきありがとうございました。以下の書籍もおすすめです。






Natchan

ゲームが好きなグラフィックデザイナー。複数のサイトを運営中。子どもの頃からPCゲームで遊んでました。1番最初に遊んだのはSecond Life。デザインとは飽きない程度に関わっていくつもり。詳しくはこちら

コメントを投稿

当サイトは広告を掲載しています