Stable Diffusion完全無料・商用利用可・ローカルPC動作のオープンソース画像生成AIです。Midjourneyのようなサブスクなしでプロ品質の画像が生成でき、カスタムモデルの導入や高度な編集も自由自在です。

Stable DiffusionとクラウドAIの違い

項目Stable Diffusion(ローカル)MidjourneyDALL-E 3
料金◎ 無料(電気代のみ)× $10/月〜△(ChatGPT経由)
画像品質○〜◎(モデル次第)
プライバシー◎(ローカル完結)△(クラウド保存)
カスタマイズ性◎(LoRA・モデル差替え)××
GPU必要○(VRAM 4GB以上推奨)××
操作の難易度△(初期設定が必要)

必要な環境

  • GPU:NVIDIA製(VRAM 6GB以上推奨)。4GBでも動作可能だがモデルによって制限あり
  • RAM:16GB以上推奨
  • ストレージ:モデル1本あたり2〜10GB。20GB以上の空き推奨
  • OS:Windows 10/11・macOS(Apple Silicon対応)・Linux

GPUなし(CPU動作)でも可能ですが、1枚生成に数分〜数十分かかります。GPUを持っていない場合はGoogle ColabやRunPodなどのクラウドGPUサービスでも動作します。

インストール方法(Stable Diffusion WebUI Forge)

  1. Python 3.10 と Git をインストール
  2. GitHubから lllyasviel/stable-diffusion-webui-forge をクローン
  3. webui-user.bat(Windows)または webui.sh(Mac/Linux)を実行
  4. 初回起動時にモデルが自動ダウンロードされ、ブラウザで localhost:7860 が開く
  5. Civitai(civitai.com)から好きなモデルをダウンロードして models/Stable-diffusion/ に配置

おすすめのモデル

モデル名得意なジャンルベースモデル
Realistic Visionリアル系写真・人物SD 1.5
DreamShaperイラスト・ファンタジーSD 1.5
Juggernaut XL高品質リアル・商業写真SDXL
Pony Diffusionアニメ・イラストSDXL
FLUX.1高精度・テキスト描画・複雑構図FLUX(新世代)

プロンプトの基本

ポジティブプロンプト(描きたいもの)とネガティブプロンプト(除外したいもの)の2つで構成します。

  • ポジティブ例1girl, long hair, blue eyes, outdoors, sunlight, highly detailed, 8k
  • ネガティブ例bad anatomy, extra fingers, blurry, low quality, watermark, text

FLUX.1を使う場合はネガティブプロンプト不要で、自然言語の詳細な説明文をそのまま入力する形が推奨されています。

LoRAで画風・キャラクターをカスタマイズ

LoRA(Low-Rank Adaptation)は追加学習データを小さなファイルで配布する仕組みです。Civitaiから好みのLoRAをダウンロードしてプロンプトに <lora:ファイル名:1> と記述するだけで、特定の画風やキャラクターを再現できます。

  • ✅ 特定の絵師の画風を再現するLoRA
  • ✅ 特定キャラクターを一貫して生成するLoRA
  • ✅ 写真品質を向上させるLoRA

GPUがない場合の代替手段

  • Google Colab:無料枠(T4 GPU)でお試し可能。長時間利用には有料プランが必要
  • RunPod:時間課金のクラウドGPU。$0.2〜/時から使えてコスパが高い
  • Stable Diffusion Online:ブラウザからそのまま試せる無料サービス(機能限定)