Stable Diffusionは完全無料・商用利用可・ローカルPC動作のオープンソース画像生成AIです。Midjourneyのようなサブスクなしでプロ品質の画像が生成でき、カスタムモデルの導入や高度な編集も自由自在です。
Stable DiffusionとクラウドAIの違い
| 項目 | Stable Diffusion(ローカル) | Midjourney | DALL-E 3 |
|---|---|---|---|
| 料金 | ◎ 無料(電気代のみ) | × $10/月〜 | △(ChatGPT経由) |
| 画像品質 | ○〜◎(モデル次第) | ◎ | ○ |
| プライバシー | ◎(ローカル完結) | △(クラウド保存) | △ |
| カスタマイズ性 | ◎(LoRA・モデル差替え) | × | × |
| GPU必要 | ○(VRAM 4GB以上推奨) | × | × |
| 操作の難易度 | △(初期設定が必要) | ◎ | ◎ |
必要な環境
- GPU:NVIDIA製(VRAM 6GB以上推奨)。4GBでも動作可能だがモデルによって制限あり
- RAM:16GB以上推奨
- ストレージ:モデル1本あたり2〜10GB。20GB以上の空き推奨
- OS:Windows 10/11・macOS(Apple Silicon対応)・Linux
GPUなし(CPU動作)でも可能ですが、1枚生成に数分〜数十分かかります。GPUを持っていない場合はGoogle ColabやRunPodなどのクラウドGPUサービスでも動作します。
インストール方法(Stable Diffusion WebUI Forge)
- Python 3.10 と Git をインストール
- GitHubから
lllyasviel/stable-diffusion-webui-forgeをクローン webui-user.bat(Windows)またはwebui.sh(Mac/Linux)を実行- 初回起動時にモデルが自動ダウンロードされ、ブラウザで
localhost:7860が開く - Civitai(civitai.com)から好きなモデルをダウンロードして
models/Stable-diffusion/に配置
おすすめのモデル
| モデル名 | 得意なジャンル | ベースモデル |
|---|---|---|
| Realistic Vision | リアル系写真・人物 | SD 1.5 |
| DreamShaper | イラスト・ファンタジー | SD 1.5 |
| Juggernaut XL | 高品質リアル・商業写真 | SDXL |
| Pony Diffusion | アニメ・イラスト | SDXL |
| FLUX.1 | 高精度・テキスト描画・複雑構図 | FLUX(新世代) |
プロンプトの基本
ポジティブプロンプト(描きたいもの)とネガティブプロンプト(除外したいもの)の2つで構成します。
- ポジティブ例:
1girl, long hair, blue eyes, outdoors, sunlight, highly detailed, 8k - ネガティブ例:
bad anatomy, extra fingers, blurry, low quality, watermark, text
FLUX.1を使う場合はネガティブプロンプト不要で、自然言語の詳細な説明文をそのまま入力する形が推奨されています。
LoRAで画風・キャラクターをカスタマイズ
LoRA(Low-Rank Adaptation)は追加学習データを小さなファイルで配布する仕組みです。Civitaiから好みのLoRAをダウンロードしてプロンプトに <lora:ファイル名:1> と記述するだけで、特定の画風やキャラクターを再現できます。
- ✅ 特定の絵師の画風を再現するLoRA
- ✅ 特定キャラクターを一貫して生成するLoRA
- ✅ 写真品質を向上させるLoRA
GPUがない場合の代替手段
- Google Colab:無料枠(T4 GPU)でお試し可能。長時間利用には有料プランが必要
- RunPod:時間課金のクラウドGPU。$0.2〜/時から使えてコスパが高い
- Stable Diffusion Online:ブラウザからそのまま試せる無料サービス(機能限定)