本レポートの価格・単価は調査時点(2026年6月)の一次情報の引用です。DRAM不足等でGPU実勢価格・クラウド単価は週単位で激しく変動します。購入・契約の直前には必ず各販売店/各クラウドの最新価格を本人が再確認してください。試算はすべて前提付きの概算であり、断定ではありません。
1結論 — まず何を買うべきか
入門・SDXL/Pony量産RTX 5070 Ti16GB / 約¥16万
[1]。SDXL・Pony・Illustriousを快適量産。FLUXはfp8/GGUFで対応
バランス本命RTX 508016GB / 約¥22万
[1]。SDXL系で4090に迫る速度
[3]。NSFW量産の主力に最適
FLUX本格・最速RTX 509032GB / 約¥71万
[1]。SDXL 4090比+42%、FLUX dev +43%
[5]。fp16フルで全部回る
超予算・中古RTX 3060 12GB約¥10万
[1]。SDXL量産は可。FLUXはGGUF Q4でギリ動く(品質低下)
[6]
3行サマリ
- SDXL/Pony/Illustriousしか使わないなら → 16GBで十分。RTX 5080 / 5070 Tiがコスパ最良。VRAMよりクロック・メモリ帯域が速度を決めるため、8GB超の余剰VRAMは速度をほぼ伸ばさない[8]。
- FLUX dev を fp16フルで本格量産するなら → 24GB以上必須。新品なら RTX 5090(32GB)、中古割安狙いなら RTX 4090 / 3090(24GB)。
- 月の生成量が読めない/初期投資を避けるなら → まずクラウド(Vast.ai / RunPod の RTX 4090)で回し、稼働が常時化したら自宅機へ。損益分岐は第8章。
迷ったらコレ: NSFW(SDXL/Pony/Illustrious中心)の量産事業なら RTX 5080 16GB 自宅機 + 繁忙期だけ Vast.ai 4090 をスポット併用 が、初期費用・電気代・拡張性のバランスで最も堅い。※価格・互換は購入直前に要再確認
2市場・前提 — なぜ「ローカル」なのか
商用画像生成API(Midjourney/DALL·E/各社クラウド)はNSFWを規約・フィルタで拒否するため、無検閲の成人向け量産は実質ローカル(自宅/自社) もしくは 検閲のない汎用GPUレンタル上で自前のComfyUIを回す一択になります。ここでの論点は「どのGPUで・いくらで・どれだけ安定して回せるか」です。
本レポートの試算前提(明記)
| 項目 | 前提値 | 根拠/注記 |
| 生成エンジン | ComfyUI | NSFWローカル量産の事実上の標準 |
| 解像度 / steps | 1024×1024 / 25〜30step | ベンチ各社の基準[3][5] |
| 電気単価(日本) | 31円/kWh(基準)/ 26〜40円(幅) | 公取協目安31円[10]、東電36.4・中部25.67[10]、jisaku基準35-40[2] |
| 想定生成量 | 月 1万枚(基準ケース) | SDXL量産事業の一目安 |
| 為替 | $1≒¥155 で円換算 要確認 | クラウド単価の円目安に使用・変動大 |
下記すべての金額は
概算です。実際の枚数あたりコストはモデル/steps/バッチ/失敗率(ガチャ再生成)で2〜3倍ぶれます。事業計画には自社実測値を必ず充ててください
[13]。
3選択肢 TOP10(用途・価格ランキング)
価格は日本実勢(2026-06-08 相場サイト[1])とクラウド各社[4][7][9]の引用。DRAM不足で実勢は乱高下中=要確認。
| # | 選択肢 | VRAM | 主用途 | 価格 / 単価 | ひとこと |
| 1 | RTX 5090 | 32GB | FLUX+SDXL最速・バッチ量産 | 約¥71.3万[1] | 消費電力575-600W=電気代も最大[2] |
| 2 | RTX 4090 | 24GB | FLUX fp16・安定量産の定番 | ¥37〜95万[1] 乱高下 | 相場サイトは¥94.8万表示=スキャルパー高騰、要確認 |
| 3 | RTX 5080 | 16GB | SDXL系コスパ最強 | 約¥21.9万[1] | SDXLで4090超えの報告[3]。FLUX dev fp16は不可(fp8/quant) |
| 4 | RTX 5070 Ti | 16GB | 入門〜中量産 | 約¥16.3万[1] | 16GBで現状の最安級・第一候補 |
| 5 | Vast.ai 4090(中断可) | 24GB | スポット最安クラウド | $0.35〜0.55/hr[7] | Interruptible=数分前通知で中断あり |
| 6 | RunPod 4090 | 24GB | 安定クラウド・秒課金 | $0.34〜0.69/hr[4][9] | Community $0.34/オンデマンド高め |
| 7 | RTX 3090(中古) | 24GB | 24GBを割安で確保 | 約¥36.9万[1] | 新品流通減・中古主体。母艦実績多数[関連] |
| 8 | RTX 4060 Ti 16GB | 16GB | 低消費電力(160-200W) | 約¥24.9万[1] 要確認 | 16GBだが帯域狭・速度は控えめ。価格表示は高め |
| 9 | Vast.ai 3090(中断可) | 24GB | 24GBを激安クラウドで | $0.12〜0.15/hr[7] | 24GBが時給20円台=実験/スパイクに最適 |
| 10 | RTX 3060 12GB | 12GB | SDXL専用・最安自宅機 | 約¥10.0万[1] | SDXL量産可、FLUXはGGUF低quantのみ[6] |
※H100/A100(クラウド $1.39〜3.29/hr[4][9])は画像生成では過剰。SDXL/FLUX量産でコスパは出ません。学習(LoRA/微調整)を大規模に回す時だけ検討。
4技術スタック — VRAM要件と高速化
モデル別 VRAM要件(実測引用)
| モデル | 精度/形式 | 必要VRAM目安 | 備考 |
| SDXL / Pony / Illustrious | fp16 | 10〜12GB(最低) / 16GB+快適 | 8GB超の余剰は速度に効かず、帯域・クロック律速[8] |
| FLUX.1 dev | fp16(フル) | 約24GB級 | ControlNet+LoRA同時は24GBでも管理必要[12] |
| FLUX.1 dev | fp8 | 約13GB | 4070Ti Super/4080級で動作[6]。T5-XXLはfp8版必須 |
| FLUX GGUF | Q8 | 約12〜13GB | 品質ほぼ維持[6] |
| FLUX GGUF | Q5 | 約6〜8GB | 軽量・品質やや低下[6] |
| FLUX GGUF | Q4 / Q3_K_S | 約7GB / 8GBに収まる例 | 8GB GPUでも可だが品質低下が見える[6]。offloadで6GB報告も[6] |
| 動画(Hunyuan/LTX 13B) | — | 24GBでもギリ/厳しい | 本格動画は別途検討[11] |
VRAM別 推奨構成(本レポートの結論)
| VRAM | 代表GPU | 回せるもの | NSFW量産での位置づけ |
| 8GB | RTX 3060(8GB)/4060 | SDXL(やや窮屈)/ FLUX Q4-Q3 | 非推奨〜お試し。バッチ不可・FLUXは品質低下 |
| 12GB | RTX 3060 12GB / 4070 | SDXL/Pony快適 + FLUX Q8 | SDXL専業の最安ライン。FLUXは量産向かず |
| 16GB | RTX 5070 Ti / 5080 | SDXL系バッチ量産 + FLUX fp8/Q8 | 本命。費用対効果が最良の量産帯 |
| 24GB | RTX 4090 / 3090 | 全モデル / FLUX dev fp16 | FLUXもfp16で安定。中古3090は割安24GB |
| 32GB | RTX 5090 | 全部最速 + 大バッチ + 動画 | 最速・将来余裕。ただし電力・価格も最大 |
ComfyUI 高速化レイヤ
SageAttentionSDPA比
1.5〜2x(head_dim128=SDXL/FLUXで最適)。動画系は2〜4x
[14]
xFormersメモリ効率良(FlashAttn相当)。50系は
アーキ別再ビルド要[11]
TensorRTSDXLで高速化可。ただしエンジン固定・FLUXは24GB超必要な場合
[15]
ComfyUI本体2026-01でpinned memory/async offloadデフォON=offload系で
10〜50%高速。03でDynamic VRAM
[6]
Blackwell(RTX 5080/5090)はCUDA 12.8世代。
一部カスタムノード・sage/triton/xformersが未対応 or 要再コンパイルの摩擦が報告されています
[11]。新品50系を量産投入する前に、自分のワークフロー一式が動くか
smoke検証必須。
5収益試算 — 1枚あたりコスト(概算)
前提: 第2章の通り(1024px・25-30step・電気31円/kWh・$1=¥155)。SDXL基準。あくまで概算で、失敗再生成・冷却ファン・空調・PC他部品の電力は含みません。
自宅機: 電気代だけの1枚コスト
| GPU | SDXL秒/枚[5] | 負荷W[2] | 1枚電気代(GPU分) | 1万枚あたり電気代 |
| RTX 5090 | 3.2s | 650W | 約0.018円 | 約180円 |
| RTX 4090 | 5.5s | 520W | 約0.025円 | 約250円 |
| RTX 5080 | 約4.8s[3] | 420W | 約0.017円 | 約170円 |
結論: 自宅機のGPU電気代は1枚あたり0.02円前後=1万枚でも数百円。電気代は実質ほぼ無視できる水準で、コストの本体はGPU初期投資の償却です。※PC全体・空調込みなら数倍だが、それでも桁は変わりません。
クラウド: 時間課金の1枚コスト
1枚 = 時間単価 ÷ (3600 ÷ 1枚秒数)
例) Vast.ai 4090 $0.45/hr・SDXL 5.5秒/枚:
3600÷5.5 ≒ 655枚/時 → $0.45 ÷ 655 ≒ $0.0007/枚 ≒ 0.11円/枚
| 選択肢 | 時間単価 | 枚/時(SDXL概算) | 1枚コスト | 1万枚 |
| Vast.ai 4090 | $0.45/hr[7] | 約655枚 | 約0.11円 | 約1,100円 |
| RunPod 4090 | $0.50/hr[4] | 約655枚 | 約0.12円 | 約1,200円 |
| Vast.ai 3090 | $0.14/hr[7] | 約450枚 | 約0.05円 | 約500円 |
クラウドの「1枚0.1円」は
GPUが常にフル稼働している前提の理論値です。実運用ではプロンプト調整・モデルロード・アイドル時間に課金され続けるため、
実効は2〜5倍に膨らみます。秒課金で「使う時だけ起動・終わったら即停止」を徹底するほど理論値に近づきます
[9]。
6リスク
価格高騰DRAM不足で5090/4090が乱高下・MSRP乖離
[1][3]。買い時を外すと数十万円差
Blackwell非互換50系で一部ノード/sage/xformers未対応
[11]。導入直後にWFが動かない事故
中断インスタンスVast/RunPodのInterruptibleは数分通知で停止
[7]。長時間バッチが飛ぶ
熱・電源5090は650-750W
[2]。電源容量(1000W+)・冷却・ブレーカ落ちに注意
VRAM奪い合い同一GPUで音声等を並走させるとswap→激遅
[13]
規約・販売面NSFW自体は技術で生成可だが、販売先(FANZA/DLsite等)の審査・モザイク規約は別途遵守が必須
730日 導入〜量産安定 プラン
| 週 | やること | 完了基準(ゲート) |
| Week1 | GPU選定・調達 or クラウド契約。ComfyUIインストール、ベースモデル(SDXL/Pony/Illustrious)導入 | 1024px・素のSDXLで1枚正常生成 |
| Week2 | SageAttention / xFormers 導入。同一WFで前後の秒/枚を実測(平均でなくstep差分で測る[13]) | 高速化で20%以上の改善を実測確認 |
| Week3 | VRAM/RAM監視を常駐化。FLUX使うならfp8/GGUF量子化の品質を目視比較。offload設定詰め | 連続100枚をフリーズ無しで完走 |
| Week4 | バッチ量産・夜間無人運転テスト。1万枚の実コスト/時間/失敗率を計測し自社実測値を確定 | 枚/時・1枚コスト・失敗率の3指標を数値化 |
Week4で出た
自社実測の「枚/時」「1枚コスト」が、以降の全意思決定(増設/クラウド併用/撤退)の基準値になります。AIや他社の数字でなく自分の実測で判断
[13]。
8撤退ライン — 自宅⇄クラウド 切替の数値基準
損益分岐(概算): RTX 5080自宅機 vs クラウド4090
自宅機の実質月コスト = 本体¥21.9万 ÷ 想定使用月数(例24ヶ月) + 月電気代
≒ ¥9,100/月 + 数百円 ≒ 約¥9,400/月(固定)
クラウド4090(常時相当)= $0.45/hr × 稼働時間 × ¥155
損益分岐 稼働時間 ≒ ¥9,400 ÷ (0.45×155) ≒ 約135時間/月
| 月あたりGPU稼働時間 | クラウド4090概算[7] | 5080自宅(償却+電気) | 有利なのは |
| 〜50時間(月数日だけ) | 約¥3,500 | 約¥9,400(固定) | クラウド |
| 約135時間(分岐点) | 約¥9,400 | 約¥9,400 | 互角 |
| 200時間+(常時量産) | 約¥14,000+ | 約¥9,400(固定) | 自宅機 |
切替の判断基準
- クラウド → 自宅機へ: 月のGPU稼働が 常時150時間(=ほぼ毎日5時間)を超えて定着したら、自宅機の方が安い。中断リスクも消える。
- 自宅機 → クラウドへ: 稼働が 月50時間未満に減った/新モデルで一時的に24-32GBが必要/繁忙期スパイクの時は、Vast.ai 3090($0.14/hr[7]=24GBが時給20円台)で凌ぐ方が安い。
- FLUX dev fp16をどうしても回したいが24GB機が無い: 買う前にクラウド4090/H100で必要性を実証してから投資判断。
※本体価格・想定使用月数・為替で分岐点は大きく動きます。上記は¥21.9万/24ヶ月/$0.45/hr/¥155の前提での概算です。
9落とし穴(実運用で踏みやすい)
- システムRAM不足がフリーズ主因: VRAMが余っていてもRAMで詰む。offload多用時は特に。32GB以上、理想64GB。量産時はメモリ監視を常駐させ閾値で解放[13]。
- VRAM奪い合い: 同一GPUで音声生成や別プロセスを並走させると、合算でVRAMが満杯→swapで17倍遅くなる事故が起きる。画像専用に1枚を割り当てる[13]。
- quant品質低下の見落とし: FLUX Q4/Q3は「動く」が、肌・指・細部の破綻が増える。安いVRAMで回す代償を必ず目視で確認してから量産に乗せる[6]。
- scalper価格でつかむ: 相場サイトが4090¥94.8万等を表示[1]するのはDRAM不足の高騰局面。MSRP・複数店・中古相場を必ず横比較。要確認。
- TensorRTの硬直: 速いがエンジンが解像度・バッチ固定になり、ワークフロー変更のたびに再ビルド。量産WFが固まってから導入が吉[15]。
- 50系を買って即詰まる: Blackwell未対応ノードでWFが動かない。導入直後にsmokeで全WF生存確認[11]。
- クラウド課金の垂れ流し: 起動したまま放置=アイドルでも秒課金。使い終わったら即terminateを癖に[9]。
- 速度をtqdm平均で見る: 平均値は嘘をつく。step差分で実測して高速化効果を判定[13]。
10既存資産(RTX 3090母艦)活用
すでにRTX 3090(24GB)母艦がある場合、新規GPU投資を急ぐ必要はありません。3090はNSFW量産の主力として十分です:
- SDXL / Pony / Illustrious: 24GBでバッチ・LoRA併用も余裕。GOLDEN勝ちパターン(シンプルprompt・cfg6・dpmpp_2m karras)での量産にそのまま接続[関連]。
- FLUX: fp8 or GGUF Q8(約12-13GB[6])で快適。fp16フルも24GBに収まる[12]。
- 増設より先にやること: ①SageAttention導入で1.5-2x[14] ②メモリ監視常駐 ③音声/他GPU処理を別枠に分離。これだけで実効スループットが伸びる。
- 母艦の限界を超えたら: 同時並列を増やしたい/FLUX fp16を高速化したい時にRTX 5080(SDXL高速)か5090(32GB・最速)を「2台目」として足すのが、3090を捨てない拡張ルート。繁忙スパイクはVast.ai 3090で水増し[7]。
手元の3090は「捨てずに主力継続+足りない時だけ買い足し/クラウド」が最もコスト効率が良い。1枚あたり電気代は3090でもSDXLで0.03円台=償却済み資産は実質タダ同然で回せます。
★三声まとめ
🤑 マネタイザー: 「電気代は1枚0.02円=誤差。コストの正体はGPU本体の償却だ。だからこそ"稼働率"が全て。月150時間以上回すなら自宅機が圧勝、回さないならクラウドで初期投資ゼロ。中途半端に高い5090を遊ばせるのが一番の損。」
💼 コーチ: 「いきなり71万の5090を買う前に、Week1-4で"自社の1枚コストと枚/時"を実測しましょう。数字が出れば増設もクラウド併用も迷いません。SDXL/Pony中心なら16GBの5080で十分戦えます。」
💕 メンター: 「手元の3090、まだ全然主力で戦えますよ。捨てずに使い倒して、足りない時だけVast.aiの3090を時給20円で借りる——それが一番賢くて、無理のない拡張です。価格高騰期に焦って高値づかみしないことだけ、約束してくださいね。」