Stable Diffusion WebUI Forge 実践運用
& 既存ComfyUIとの使い分け最適化

合法R18制作事業者(FANZA/DLsite/Booth・ComfyUI + waiIllustriousSDXL_v160 量産中)向け Deep Research / 2026-06-15
一次情報20件・全URL脚注 版数/フラグ裏取り済 不確かは「要確認」明示 Forge×ComfyUI分業表 12章構成
本DRの立ち位置(重複回避): 既存DR DR_uncensored_local_sd_comfyui_2026-06-15.html は「12ツール横断比較」、DR_comfyui_workflow_2026-06-04.html は「ComfyUI単体ワークフロー」。本DRはそれらと差別化し、「既にComfyUIで量産中の事業者がForgeを"小回り検証機"として追加導入する実運用」に特化する。フォルダ流用・必須拡張の実機対応状況・低VRAM設定・トラブル回避・分業設計に絞った実装DRである。
1. 結論(エグゼクティブサマリ) 2. 市場/位置づけ・系譜 3. 競合ツール比較TOP 4. 技術スタック(版数/フラグ) 5. 収益/工数試算 6. リスク 7. 30日導入プラン 8. 撤退ライン 9. ありがちな落とし穴 10. 既存資産活用(フォルダ共有) 11. 必須拡張表&分業表 12. まとめ・次の一手+関連DR 脚注(一次情報20件)

1. 結論(エグゼクティブサマリ)

① Forge = 「1枚をさくっと、プロンプト・構図・LoRA強度の当たりを高速に出す」検証機。 既存のComfyUI量産パイプラインは一切置き換えない。確定レシピの大量生成はComfyUIのまま、試行錯誤フェーズだけをForgeに移すと総工数が縮む。

② R18はそのまま動く。 Forge系はsafety/NSFWフィルタを前提に持たないA1111派生のため、検閲解除作業は不要。R18・キャラ固定・年齢表現はモデルとプロンプト側で担保する(社内ルール: mature/adult禁止・髪色目色冗長固定をForgeのプロンプトにもそのまま適用)。

③ 導入は本家(lllyasviel)を別venvで。Neo(Haoming02)は様子見。 Neoは最新モデル追従だが PyTorch 2.11.0+cu130 採用[6]で、社内ComfyUIで実害が出た版と同系統[18]。まず本家の安定版で運用を固めるのが最小リスク。

一言分業: Forge=小回り・当たり出し・低VRAM救済 / ComfyUI=確定レシピの量産パイプライン(GOLDEN踏襲)。両者は同一GPUで同時起動しない(VRAM奪い合い実害[18])。

CUDA12.1
PT2.3.1
本家ワンクリック推奨構成[1]
~45%RTX3060 SDXLでA1111比 短縮(目安・要確認)[14]
0.7–1.3GBVRAMピーク削減(目安)[14]
30/50%GPU Weight開始値 8GB/12GB(目安)[15]

2. 市場/位置づけ・系譜

Forgeは AUTOMATIC1111(A1111) WebUIをベースに、メモリ管理と推論を最適化したフォーク。A1111の拡張・UI資産を引き継ぎつつ、独自のUnetPatcher / GPUメモリ管理システムを実装している[1]。R18量産事業者にとっての価値は「ComfyUIワークフローを崩さずに1枚出しの試行速度を補える」点に尽きる。

系譜(3系統を混同しないこと)

系統主体性格採用環境(裏取り)R18事業者の使いどころ
本家 ForgelllyasvielA1111派生の本流。Flux NF4/GGUFネイティブ対応[1]ワンクリック推奨= CUDA 12.1 + PyTorch 2.3.1[1]第一候補。SDXL中心の安定運用
Forge ClassicHaoming02(classic branch)SD1/SDXL安定志向。本流の整理版Neo系の安定枝(版数は枝で異なる=要確認)[5]SDXLを枯れた構成で回したい時
Forge NeoHaoming02(neo branch)最新モデル追従。Gradio 4.40.0、SD2/SD3・Hypernetworks・Deepbooru等を削除、Comfy式メモリ管理を再実装[6]Python 3.13.12 / PyTorch 2.11.0+cu130 推奨[6]最新モデル(Qwen-Image/Flux.2等)を試す時のみ。常用は様子見
Neoは Flux.2-Klein / Qwen-Image / Wan2.2(動画) / Chroma 等の最新モデルに対応し[6]、fp4/fp8/mxfp8・SageAttention/FlashAttention・.avif/.heif/.jxl出力など先進機能が多い。ただし破壊的更新が頻繁で拡張が壊れやすい(後述§6/§11)。SDXL R18量産が主目的なら本家/Classicで十分。

3. 競合ツール比較TOP(R18事業者視点)

ツール強み弱み/注意本事業者での役割
ComfyUI(既存)ノードで確定レシピを量産・自動化。社内GOLDEN/番人/ゲート運用が蓄積済1枚の試行錯誤はノード編集が重い。torch2.11+cu130でKSamplerハング回帰の社内実害[18]量産の本丸(継続)
Forge 本家A1111同等UIで即1枚出し。VRAM最適化・GPU Weightスライダ[1]。Flux NF4/GGUF対応[1]ControlNet Union/Flux未実装[1]。OFT LoRA「broken pending fix」[1]小回り検証機(導入推奨)
Forge ClassicSD1/SDXLを枯れた構成で安定運用[6]最新モデル非対応。一部機能削除安定枝の予備
Forge Neo最新モデル追従・先進量子化[6]torch2.11+cu130[6]・拡張破壊的更新新モデル実験のみ
A1111拡張エコシステム最大・再現性Forge比でVRAM多め・遅い傾向[14]。本流の更新は緩慢Forgeで動かぬ拡張の逃げ場
SwarmUI 等(本DR一次情報なし)要確認
R18観点: Forge本家・Classicとも、A1111系と同じくNSFW安全フィルタを実装しない前提で動く=検閲解除作業は不要。一方で「合法R18の品質・キャラ固定・年齢表現」はモデル/プロンプト/LoRA側の責任。社内ルール(mature/adult禁止・若く可愛く・髪色目色を冗長固定+他色NEG)はForgeのプロンプト欄にもそのまま移植すること。

4. 技術スタック(版数・フラグ・流用設定)

4-1. インストール2系統

A. ワンクリックパッケージ(本家・推奨): git/python同梱。推奨ビルドは Forge with CUDA 12.1 + Pytorch 2.3.1[1]update.batで更新→run.batで起動。更新を怠ると既知バグ未修正版のまま動く点に注意[1]。CUDA12.4ビルドはMSVC/xformers問題の可能性が注記されている[1]
B. Advanced install(既存A1111/環境を再利用): Forgeリポをgit cloneして webui-user.batを実行。既存OG SD-WebUIの全checkpoint・全extensionを再利用可能(ただし"you should know what you are doing"と本家が明記)[2]

4-2. 既存ComfyUIのモデル/LoRAを流用する起動フラグ

webui-user.bat(Win)/webui-user.sh(Linux)の COMMANDLINE_ARGS= に追記する。Windowsパスはforward slash か single backslashを使う(C:/...C:\\...のエスケープ事故回避)[3]

set COMMANDLINE_ARGS= ^
  --ckpt-dir   "D:/.../ComfyUI/models/checkpoints" ^
  --lora-dir   "D:/.../ComfyUI/models/loras" ^
  --vae-dir    "D:/.../ComfyUI/models/vae" ^
  --embeddings-dir "D:/.../ComfyUI/models/embeddings"

個別フラグ --ckpt-dir / --lora-dir 等が利用可[3]。A1111互換ディレクトリ群を丸ごと参照する近道として --forge-ref-a1111-home ../path/to/A1111 も提示されている[3](これはA1111のフォルダ構成を前提とした参照で、ComfyUIのフォルダ構成とは異なるため、ComfyUI流用には個別 --*-dir 指定が確実)。

要確認: --controlnet-dir 等の網羅は本家README未掲載で、コミュニティ報告ベース[3]。実機で1度起動ログを確認し、各フォルダが認識されたかをUIのモデルリストで目視すること(社内ハルシネーション対策=断定せず実機照合)。

4-3. 最適化フラグ(コミュニティ確認・要実機検証)

フラグ役割(報告ベース)出典
--xformers / --force-enable-xformers / --xformers-flash-attentionattention最適化[4]
--unet-in-fp8-e5m2 / --clip-in-fp8-e5m2fp8でVRAM削減[4]
--pin-shared-memory / --cuda-malloc / --cuda-streamメモリ/ストリーム最適化(Neoのbatコメントにも記載)[4][5]
--sage / --uvSageAttention / uvパッケージャ(Neo)[5]
--skip-torch-cuda-test 他 skip系環境チェック回避(副作用注意・§9)[5][16]

いずれも「動作報告あり」のフラグ。GPU/torch構成で挙動が変わるため、まず無フラグで起動→1つずつ追加して速度/安定を実測すること(社内: 重weight・盛りすぎは逆効果の前例)。

5. 収益/工数試算(数値は目安・要確認)

収益インパクトの本体は「確定レシピに到達するまでの試行時間短縮」。1枚出しが速いほど、構図/プロンプト/LoRA強度の当たりを早く掴め、ComfyUI量産に渡すまでのリードタイムが縮む。

指標(目安)A1111Forge出典/注
RTX3060 SDXL 1枚約35秒約24秒(~45%短縮)二次・ハード依存[14]
VRAMピーク(同テスト)10.2GB8.9GB0.7–1.3GB削減[14]
低VRAM動作4GBでSDXL/2GBでSD1.5(フラグ無し)ただしGPU Weight誤設定で激遅[14]
工数試算の考え方(自社で実測前提): 仮に1キャラの「当たり出し」で30枚試行するなら、1枚11秒短縮×30枚=約5.5分/キャラの直接短縮。価値の大半は秒数より「UIで即パラメータを振れる軽さ」=試行回数を増やせることにある。量産はノード自動化のComfyUIが効率で勝るため、当たり出し=Forge / 量産=ComfyUIの分業が費用対効果で優位。A6000等の高VRAM機では差が約35%に縮む報告[14]=高VRAM機ほどForge導入の速度メリットは小さい(投資判断の分岐点)。

6. リスク

7. 30日導入プラン(週次)

Week 1 — 隔離インストール&フォルダ共有

Week 2 — 低VRAM最適化&速度実測

Week 3 — 必須拡張を最小導入&干渉検証

Week 4 — 運用ルール確定&分業固定

8. 撤退ライン(入れない/やめる基準)

いずれか2つ以上恒常化したら導入見送り/撤退。ComfyUI単独運用に戻すのは後退でなく正解(量産の本丸を守る判断)。

9. ありがちな落とし穴

症状原因対処出典
"Torch is not able to use GPU"で起動失敗torch/cuda不整合。特にRTX50xxはCUDA12.8+と新しいtorch必須正しいtorch再インストール(下記)。--skip-torch-cuda-test検査を飛ばすだけで根治せずハング誘発[16]
"Your device does not support the current version of Torch/CUDA"GPU世代とtorch版の不一致venv作り直し+対応cu版torch導入[16]
生成が突然3分40秒級に激遅GPU Weight高すぎで演算用VRAM枯渇・VRAMスラッシングGPU Weightを下げる(低いほど演算VRAM空き高速化)。8GB→30%/12GB→50%目安[14][15]
ADetailer導入後に突然torch/cuda不整合拡張がtorchを巻き込み再インストールする副作用拡張導入前にvenvバックアップ。導入後にtorch版を再確認[17]
tagcompleteのpopupが出ない/inline表示Forge更新でshared_paths不整合・Classicでhypernetwork_dirエラー(hypernetworks削除のため)対応版(3.3.0+)使用。Neo最新で出ない報告あり=要確認[9]
Regional Prompter入れたら他拡張のcheckbox挙動が変拡張間干渉不要時は無効化。Forge純正のsd-forge-coupleで代替検討[10][11]

torch再インストール(裏取り済コマンド・cu128例)

# venv作り直し(Win)
rmdir /s /q venv
py -3.10 -m venv venv

# CUDA12.8用 torch (cu129/cu130は末尾を差し替え)
python -m pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 \
  --index-url https://download.pytorch.org/whl/cu128 \
  --extra-index-url https://pypi.org/simple

# 検証(Trueが出れば成功)
python -c "import torch; print('CUDA', torch.version.cuda, 'avail', torch.cuda.is_available())"

出典[16]。GPU世代に合うcu版を選ぶこと(社内ComfyUI実害から: torch2.11+cu130は回避し2.6+cu124が安定だった[18]=Forge側でも安定版を選ぶ思想は同じ)。

10. 既存資産活用(二重持ち回避の具体手順)

  1. モデルは1か所(ComfyUI/models)に集約し、Forgeは参照のみ。 §4-2の --*-dir でComfyUIのcheckpoints/loras/vae/embeddingsを指す[3]。waiIllustriousSDXL_v160等を二重ダウンロードしない(ディスク節約+バージョン齟齬防止)。
  2. Forgeは独立venv。 パッケージ依存をComfyUIと分離し、片方の更新事故がもう片方に波及しないようにする(VRAMは共有だが環境は分離)。
  3. 社内GOLDENはComfyUI側に温存。 Forgeは「当たり出し」専用=cfg6.0/dpmpp_2m karras/1024/steps30/シンプルプロンプトの勝ちパターンをForgeで素早く再現→ComfyUIの確定ワークフローに転記。
  4. キャラLoRA・色ロックNEG・若さNEGをそのまま流用。 ComfyUIで使っているプロンプト/NEG(mature/adult/milf禁止、髪色目色冗長固定+他色NEG)をForgeのプロンプト欄に貼って使う=R18品質ルールを環境間で統一。
  5. パスはforward slash。 Windowsで C:/... 形式にしてエスケープ事故を避ける[3]

11. 必須拡張表 & Forge×ComfyUI分業表

11-1. 主要拡張のForge対応状況(要確認込み・断定回避)

拡張Forge本家Forge Neo代替/備考出典
ControlNetビルトイン(sd_forge_controlnet)ビルトインUnion/Flux系は未実装。SDXL系の基本制御はOK[1][12]
領域別描き分けsd-forge-couple(純正)sd-forge-coupleSD1/SDXLのみ対応。色/特徴の混ざり防止に有効。Attention Couple実装[10]
Regional Prompter要確認要確認Forge用フォーク sd-forge-regional-prompter[13]。本家版は破綻/他拡張干渉報告。couple優先推奨[11][13]
ADetailer(顔/手の自動高精細化)動作報告あり(版依存)Neo更新で停止報告[8]READMEは「A1111のみテスト」。代替= μDDetailer(uddetailer)。"完全に壊れた"は未確定=自機で要検証[8]
tagcomplete(booru補完)3.3.0でForge対応Neo最新で出ない報告[9]Classicで hypernetwork_dir エラー報告(hypernetworks削除のため)。styling崩れ報告も[9]
Forge拡張一覧Discussion #1754 にForge用フォークのクラウドソース一覧(deforum/ic-light/ar-plusplus/faceswaplab 等30+)導入前にこの一覧で対応版を確認[13]
運用指針: R18量産で必須の「顔/手の高精細化」はComfyUI側のADetailer相当(FaceDetailer等)で確定処理する方が安全。Forgeでは当たり出しに集中し、拡張は最小限(ControlNet+couple+tagcomplete程度)に留めるのが事故が少ない。

11-2. Forge × ComfyUI 分業表

工程担当理由・根拠
プロンプト/構図/LoRA強度の当たり出しForgeUIで即パラメータ変更・1枚速い[14]
低VRAM機での救済生成ForgeGPU Weight/Swapで4GBでもSDXL[14][15]
確定レシピの大量生成(Vol量産)ComfyUIノード自動化・番人/ゲート・GOLDEN運用[18]
顔/手の自動高精細・パイプライン後処理ComfyUIFaceDetailer等が安定。Forge ADetailerは版依存[8]
Union/Flux系ControlNet制御ComfyUIForge本家は未実装[1]
最新モデル(Qwen/Flux.2)の試用Forge Neo最新追従。ただしtorchリスク承知の上で[6]
R18品質ルール(色/年齢/キャラ固定)両方共通プロンプト/NEG/LoRAを環境間で統一

12. まとめ・次の一手

結論再掲: Forgeは「ComfyUI量産を守りつつ、当たり出しを高速化する小回り検証機」。本家を別venvで導入→models共有→GPU Weight調整→当たり出しはForge/量産はComfyUIの分業を1か月で固める。NeoとADetailer/tagcompleteは「動けば使う、ダメなら代替/見送り」の温度感が安全。

次の一手: ①本家ワンクリック(CUDA12.1+PT2.3.1)を別フォルダに展開 → ②--*-dirでComfyUI models共有 → ③waiIllustriousSDXL_v160で社内R18プロンプトの疎通+速度を自機実測 → ④分業/同時起動禁止/撤退ラインを手順書化。

🤑 マネタイザー: 速度メリットの本体は「秒」じゃなく「試行回数」っす。当たり出しが速い=ハズレVolを作る前に勝ち筋を掴める=制作の歩留まりが上がる。導入コストはほぼ0円(モデル共有で二重持ちなし)、失敗しても捨てるだけ。投資対効果は高い。

💼 コーチ: 鉄則は「量産の本丸=ComfyUIを絶対に揺らさない」。Forgeは別venv・別フォルダ・同時起動禁止で隔離。Neo常用と拡張一括更新だけは量産期に絶対やらない。撤退ラインを先に決めてから入れること。

💕 メンター: 焦らなくて大丈夫。まずは1枚を気持ちよくサッと出せる体験から。プロンプトを軽く振れる楽しさが戻ってくると、量産も上手くなります。数値は全部"自分の機械で測ってから"信じましょうね。

関連DR一覧(D:\市場調査資料\)


脚注(一次/権威情報・全URL)

  1. lllyasviel/stable-diffusion-webui-forge(本家リポジトリ・README): ワンクリック推奨ビルド・Flux NF4/GGUF・GPU weight slider・ControlNet Union/Flux未実装・OFT LoRA broken。 https://github.com/lllyasviel/stable-diffusion-webui-forge
  2. 同README(Advanced install): 既存SD-WebUIのcheckpoint/extension再利用。 https://github.com/lllyasviel/stable-diffusion-webui-forge#installing-forge
  3. Discussion #697 "How can I point to a shared models folder?": --ckpt-dir/--lora-dir/--forge-ref-a1111-home・Windowsパスはforward slash。 https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/697
  4. Discussion #682 "Arguments?": --xformers系/--unet-in-fp8-e5m2/--pin-shared-memory/--cuda-malloc/--cuda-stream 動作報告。 https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/682
  5. Haoming02/sd-webui-forge-classic (neo) webui-user.bat: COMMANDLINE_ARGSコメントのフラグ一覧(--sage/--uv/skip系)。 https://github.com/Haoming02/sd-webui-forge-classic/blob/neo/webui-user.bat
  6. Haoming02/sd-webui-forge-classic(Forge Classic/Neoフォーク): Gradio4.40.0・削除機能・Python3.13.12/PyTorch2.11.0+cu130・最新モデル対応。 https://github.com/Haoming02/sd-webui-forge-classic
  7. 同(classic branch) webui-user.bat(安定枝の参照)。 https://github.com/Haoming02/sd-webui-forge-classic/blob/classic/webui-user.bat
  8. Haoming02/sd-webui-forge-classic Issue #769 "Why did ADetailer stop working? Forge neo has been updated": Neo更新後のADetailer不調・μDDetailer(uddetailer)代替言及。 https://github.com/Haoming02/sd-webui-forge-classic/issues/769
  9. DominikDoom/a1111-sd-webui-tagcomplete Issue #320(Forge Classic対応)/#337(Neoで動かない)/#299(shared_paths)/#323(styling): Forge各版での対応・不具合。 https://github.com/DominikDoom/a1111-sd-webui-tagcomplete/issues/320
  10. Haoming02/sd-forge-couple: Forge Classic/Neo対応・SD1/SDXLのみ・Attention Coupleによる領域別描き分け。 https://github.com/Haoming02/sd-forge-couple
  11. hako-mikan/sd-webui-regional-prompter Issue #394 / forge Issue #1007: Regional Prompter導入による他拡張checkbox挙動変化・Forgeでのエラー報告。 https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/1007
  12. Forge組込ControlNet(extensions-builtin/sd_forge_controlnet): ビルトイン実装の所在。 https://github.com/lllyasviel/stable-diffusion-webui-forge/tree/main/extensions-builtin/sd_forge_controlnet
  13. Discussion #1754 "Forge Extension List and Extension Replacement List": Forge用フォーク一覧(sd-forge-regional-prompter/deforum/ic-light/ar-plusplus/faceswaplab 等)。 https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/1754
  14. QWE AI Academy "Forge vs A1111: Why Most Benchmarks Miss the Real Story"(二次・目安): RTX3060 SDXL 24s vs 35s・VRAM 8.9GB vs 10.2GB・GPU Weight誤設定で3分40秒・4GBでSDXL。 https://www.qwe.edu.pl/tutorial/stable-diffusion-forge-vs-automatic1111-comparison/
  15. Forge GPU Weight/Swap設定(二次・目安): 8GB→30%/12GB→50%開始・Queue(安定)/Async(高速)。MimicPC "Run Flux.1 NF4 on WebUI Forge"。 https://www.mimicpc.com/learn/run-flux-nf4-on-webui-forge
  16. Forge Issue #521 "Torch is not able to use GPU" / #988 / #2840: torch/cuda不整合・--skip-torch-cuda-testハング・venv作り直し・cu128 torch再インストール例。 https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/521
  17. Forge Issue #1784 "Your device does not support... after installing adetailer": ADetailer導入後のtorch/cuda不整合。 https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/1784
  18. 社内一次知見(MEMORY.md / feedback_comfyui_sampling_hang_torch2_11_cu130_2026-06-12.md・feedback_no_comfy_during_training_kill_rogue_factories_2026-06-14.md): torch2.11+cu130でComfyUI KSamplerハング回帰の実害(torch2.6+cu124で解消)・同一GPU並走でのVRAM奪い合い・GOLDEN量産パターン。(社内ファイル・外部URLなし)
  19. RTX50xx向けForge/CUDA対応(二次・補足): andreaskuhr.com "Fooocus, Forge WebUI and Automatic1111 on NVIDIA RTX 50xx"。 https://andreaskuhr.com/en/fooocus-forgewebui-automatic1111-nvidia-rtx-50xx-graphics-card.html
  20. Forge Issue #2840 "Your device does not support the current version of Torch/CUDA"(RTX50xx/新CUDA要件の裏取り)。 https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/2840

注: 脚注14・15・19は二次情報のため「目安・要確認」と本文で明示。数値・版数・フラグは可能な限り一次(GitHub README/Discussion/Issue)で裏取りし、未掲載のものは「要確認」とした(社内ハルシネーション対策準拠)。導入時は必ず自機の起動ログ・実測で照合のこと。

— Deep Research / R18制作事業者向け・2026-06-15 / 一次20件裏取り・断定回避・分業特化 —