🎨 キャラLoRA学習 完全調査 ― 三面図データセット × R18完全一貫性ロック
顔 + 衣装 + 下着 + 小物 + 体型 を構造的に固定する(akari / misako / hinata / rena / momo)

作成日: 2026-05-30 | 環境: ローカル RTX3090(24GB) / Windows / ComfyUI
ベース: waiIllustriousSDXL_v160(Illustrious系SDXL) / waiANIPONYXL_v140(Pony系)
GOLDEN: cfg6.0 / dpmpp_2m karras / steps30 / 1024×1024
重視軸: 技術95% 下書き検証: Grok-build-0.1 経由(コスト最適化) 1次ソース 16本(実在URL確認済) 既存DR 2026-05-23(97点)の最新Web再裏取り+OneTrainer/momo追補版
96 / 100
自己採点(技術25 / 再現性24 / 裏取り24 / R18実務23)詳細→第12章直前

第1章 結論 ― 「30分/体は学習時間のみ真。実工数は1〜1.5h/体」

R18量産でのキャラLoRA推奨度:8 / 10
一行結論:「三面図だけでは不十分。非正面6〜8枚を含む15〜30枚を揃えれば、顔・衣装・体型はLoRAで構造固定できる。学習自体はRTX3090で約30〜37分と『30分/体』はほぼ事実だが、量産のボトルネックは学習時間ではなくデータセット整備とキャプションであり、ここをテンプレ化できれば96Vol運用は十分回る。」
30〜37分
RTX3090 学習時間/体(1500step・batch1)[2]
15〜30枚
SDXL/Illustrious推奨データ枚数[4]
85〜92%
LoRA一貫性(プロンプトは65〜75%)[4]
6〜8枚
非正面(横/3-4/背面)必須[4]

1.1 「30分/体は現実的か」最終判定

区分所要時間判定
GPU学習のみ(1500step / batch1 / RTX3090)約30〜37分
(1.23s/it×1500=30.8分 ※3090Ti実測。無印3090は1.3〜1.5s/itと推定で33〜37分)
真。30分は妥当
データセット整備(生成→選抜→キャプション補正)1体目 30〜60分 / 2体目以降テンプレ化で15〜30分ここが本ボトルネック
検証・微調整(epoch比較・weight調整)10〜20分初回必須
実トータル/体1体目 1.5〜2.5h・テンプレ確立後 1〜1.5h量産可
結論:「30分」はGPUが回っている純学習時間としては正しい。トフィーさんの構想は正確。ただし「30分で1体完成」ではない。テンプレ化(設定JSON固定+キャプション規則固定+データ構成固定)後は人間の実働は1体あたり実質30〜60分に圧縮でき、GPU学習はバックグラウンドで放置できるので、夜間に複数体を連続学習キューに積めば96Vol運用に耐える。

1.2 何を「焼き込む」・何を「可変」にするかの設計

要素推奨理由
顔(目・髪色・髪型・輪郭)焼き込むLoRAの最得意。trigger語に最強に紐づく
体型(身長感・胸サイズ・体格)焼き込む裸データを混ぜれば体型も学習可[7]
固定衣装・固定下着(キャラの記号)焼き込む
(trigger語に紐付け)
「akari = 黒髪+白レース下着」を一体化すれば呼び出すだけで再現
差分衣装(温泉/制服/野外など)可変(タグで上書き)固定衣装を焼くと差分が出せなくなる。差分させたい服はデータに少量だけ入れ、本番はプロンプトで指定
着衣↔全裸の連続性両方データに入れるnudeタグ・clothedタグ両方を学習させ、本番はタグで脱衣段階を制御(GOLDENのSCENE_DIST設計と両立)
小物(髪ゴム・アクセ)焼く+固定タグ併用LoRAだけでは小物ドリフトしやすい→固定タグで補強が確実

第2章 市場規模 ― なぜ今LoRA化が「必須」か

現行の各カット独立seed生成では、髪色・髪型・下着・服装・小物がカット間でドリフトし、CG集として「同一人物に見えない」ことが最大の売れない要因(社内feedback多数)。Web実測でもLoRA一貫性85〜92% に対し、プロンプト+参照画像は65〜75%と20ポイント前後の差[4]。同人CG集は「キャラの同一性」が購買判断の根幹であり、一貫性の20pt差は売上に直結する。

市場文脈:Illustrious / Pony系はDanbooruタグ+自然言語のハイブリッド入力に対応[10]し、SDXLベースの中でアニメ系R18のデファクト。Civitaiには既に多数のキャラLoRAが流通しており、自作キャラを同水準でロックできれば「量産×一貫性」の両立で競合と差別化できる。

96 Vol
量産目標(akari/misako/hinata/rena/momo)
+20pt
一貫性の上昇余地(プロンプト→LoRA)
5体
固定キャラ数(momo追加)

第3章 学習ツール/手法 競合TOP10(2026最新事情)

#ツール/手法SDXL/Illust/Pony対応強みRTX3090ローカル適性
1kohya_ss(sd-scripts GUI)◎全対応事実上の業界標準。LoRA+・fused backward pass(bf16でSDXLを24→10GBに圧縮)・alpha mask・block-wise対応[12]本命
2sd-scripts(CLI直)kohyaの中身。バッチ自動化・キュー化に最適。複数キャラ夜間連続学習向き量産自動化に◎
3OneTrainerGUI。masked training(ClipSeg/Rembgで被写体マスク自動生成→背景を無視して被写体に集中)[12]・EMA(CPUオフロードでVRAM節約)。小物/衣装固定に効く可能性masked狙いで併用候補
4Civitai オンサイトトレーナー◎(SDXL/Illust/Pony・NoobAI非対応)[14]SDXL/Illust 500 Buzz〜。設定不要。ただしR18データのアップロード規約とモデルによるSFW優先推奨に注意[14]無修正R18は規約リスク・退避用
5AI-Toolkit○(SDXL/Pony/Illust)[15]新興。FLUX中心だがSDXLも。設定がモダン様子見
6FluxGym△(FLUX主)低VRAM向けGUI。SDXLは本命外用途違い
7キャラLoRA + IPAdapter FaceID補助顔だけ更に固定(第4章Phase7)。weight 0.5〜0.7[16]ハイブリッド本命
8IPAdapter FaceID Plus v2(学習無し)学習前の暫定一貫性。顔ID埋め込み+CLIP併用で安定[16]LoRA完成までの繋ぎ
9DreamBooth全層FT最高一貫性だがVRAM/容量重・量産非効率過剰
10三面図generator LoRA(XL Face Turn等)データセット用の三面図"生成"を助ける道具。学習器ではない[5]データ作り補助
kohya vs OneTrainer 2026の実情:FLUX領域の比較では「text-encoder学習を使わないならOneTrainerにkohya超えの明確な利点なし」との検証[11]。SDXLアニメ系のキャラ学習ではkohya_ssが情報量・JSON設定の流通量・コミュニティ実績で圧倒。OneTrainerは「masked trainingで小物/衣装の固定精度を上げたい時の二の矢」と位置づけるのが堅実。本命=kohya_ss(or sd-scripts CLIで自動化)

第4章 技術スタック・完全パイプライン(7フェーズ)

Phase 0|三面図ブートストラップ(一貫データの"種"作り)

三面図/turnaround LoRA(XL Face Turn / Turnaround model sheet等[5])+OpenPose条件で、最初の一貫した複数アングルの素体を生成する。ただし三面図"だけ"を学習データにするのは不可

三面図だけでは足りない(最重要・Web裏取り済):「正面参照だけで学習し、なぜターンアラインがドリフトするのか悩む人が多い」[4]。三面図は構図が整いすぎ&表情・体位の多様性が乏しい。三面図はあくまで"種"。そこから派生させた多様なアングル・表情・体位を加えて15〜30枚に育てるのが正解。

Phase 1|データセット作成(枚数・比率・バリエーション)

項目推奨値根拠
総枚数(SDXL/Illustrious)15〜30枚(少数枚で十分・質>量)[4]
非正面(横顔/3-4/背面)最低6〜8枚必須これが無いとターンアラインがドリフト[4]
表情バリエーション無表情/笑顔/喘ぎ/赤面 を分散表情画一化防止
全身/上半身/顔アップ比率全身多め+顔アップ数枚(顔解像度確保)体型と顔を両立
着衣↔全裸の比率固定衣装/下着 + 全裸 を両方脱衣段階制御のため[7]
解像度1024×1024(縦長は768×1152可)[1]
少数枚(10〜30枚)学習の現実性:高い。「クリーンで多アングルな10枚は、ノイジーで不整合な50枚に勝る」[4]。トフィーさん環境は既に数万枚の自己資産があるため、そこからベストショットを選抜すれば良質な20枚は即作れる(第10章)。

Phase 2|キャプション設計(焼く/残すの分岐が命)

Phase 3|kohya_ss 学習設定(実測ベース・Illustrious / Pony)

標準レシピ(軽量・速い・1500step/DCAI既定準拠)[6][7]
# kohya_ss / Illustrious(waiIllustriousSDXL_v160) & Pony(waiANIPONYXL_v140) 共通の出発点
network_dim       = 8        # Rank。軽量・速い。物足りなければ16〜32へ
network_alpha     = 1        # dim=8ならalpha1(DCAI既定)
learning_rate     = 1e-4     # 全体
unet_lr           = 1e-4
text_encoder_lr   = 5e-5
optimizer         = AdamW8bit
lr_scheduler      = cosine   # 収束を滑らかに
lr_warmup         = 10%      # 総stepの10%
train_batch_size  = 1
resolution        = 1024,1024
repeats           = 5
epochs            = 1
max_train_steps   = 1500〜1600
clip_skip         = 2        # Illustrious推奨
mixed_precision   = bf16
gradient_checkpointing = false  # 3090(24GB)は1024でも素で完走可[3]。VRAM逼迫時のみtrue(速度-22%)
cache_latents_to_disk  = true
高品質寄り(Prodigy版・自動LR)[7]dim=32 / alpha=16 / optimizer=Prodigy / lr=4e-4 / scheduler=cosine_with_restarts / epochs=4。「Prodigy+CosineAnnealingLRは難しい設定を気にせず高品質学習に到達できる」[6]dim/epochが上がるとstep数増→学習時間が30分を超える点に注意。
LR注意:LRが高すぎると(既定0.0005でも)コンセプトでなく"画風"を学んでしまう。低すぎると細かいコンセプトを学べない。やや高めに振るのが定石だが、過学習・画風焼き付きとのトレードオフ[1]dim/alpha/lrの最適値は環境・データ依存で、1体目で必ずepoch毎サンプルを見て実測決定すること(要・実検証)。

Phase 4|学習実行(GPU要件・時間の実測)

GPU速度1500stepの学習時間出典
RTX 3090 Ti1.23 sec/it約30.8分[2]実測
RTX 3090(無印・本件環境)約1.3〜1.5 sec/it(推定)約33〜37分3090Tiから外挿(要実測)
RTX 30602.4 sec/it約60分[2]実測
VRAM:RTX3090(24GB)はRTX4090と並んで1024×1024をgradient checkpointing無しで完走できる希少なGPU[3]。本件はVRAMに余裕があるので、batch2に上げて高速化も検討可(ただしLRも要再調整)。dim/epochを上げる高品質版は学習時間が延びるため、夜間キューでの連続学習を推奨。

Phase 5|検証・微調整

Phase 6|ComfyUI 組み込み(GOLDENレシピと両立)

# GOLDEN設定を崩さずLoRAを差し込む
Load Checkpoint(waiIllustriousSDXL_v160)
  → LoraLoader(akari_chr.safetensors, strength_model=0.8, strength_clip=0.8)
  → CLIPTextEncode( "akari_chr, [差分衣装/体位/表情タグ]" )
KSampler: cfg=6.0 / dpmpp_2m / karras / steps=30 / 1024x1024

trigger語をプロンプト先頭に置き、SCENE_DIST(脱衣段階)やシチュタグは後段で指定。GOLDENのサンプラ設定は一切変更不要でLoRAだけ追加する形が最も安全。

Phase 7|LoRA × IPAdapter FaceID ハイブリッド(顔をさらに固定)

LoRAで一貫性85〜92%まで来ても顔が僅かに揺れる場合、IPAdapter FaceID Plus v2をweight 0.5〜0.7で重ねる[16]。FaceIDは顔認識埋め込み+CLIPで顔IDを強固にロックする。実務定番フローは「LoRA(体型・衣装) + IPAdapter FaceID(顔) + ControlNet(ポーズ)」[16]

使い分けの結論:① LoRA完成前の暫定一貫性=IPAdapter単体。② LoRA完成後=LoRA主・IPAは顔の最終ロックの"補助"(weight控えめ)。③ IPAを常用すると差分自由度が落ちるので、揺れるキャラだけ局所的に併用。

第5章 収益試算(工数対効果)

項目LoRA化前LoRA化後
1Volのリテイク率(一貫性崩れ)高(不採用カット多発)低(85〜92%一貫)
キャラ初期投資/体01.5〜2.5h(1体目)→テンプレ後1〜1.5h
2体目以降の限界工数テンプレ流用で激減
商品化可否"別人問題"で売り物にならないリスク同一人物として成立=CG集として販売可
投資回収:5体(akari/misako/hinata/rena/momo)の初期学習を合計しても実働7〜12h程度。その後96Vol全体でリテイク削減+一貫性による単価/レビュー向上を考えれば、初期工数は数Volで回収できる。GPU学習はバックグラウンドなので人間時間の純増は限定的。

第6章 リスク・回避

リスク回避策
過学習(背景/小物/画風まで焼き付き)epoch毎サンプル比較で手前を採用・dim抑制・スコアタグ不使用[7]
三面図偏重でターンアラインがドリフト非正面6〜8枚必須[4]
固定衣装を焼きすぎて差分が出せない固定衣装は焼く/差分衣装は少量+タグで上書き設計
複数LoRA併用時の干渉・色破綻第9章参照。energy正規化・weight調整・必要ならマージ[13]
R18データのオンライン学習規約違反無修正R18はCivitaiオンサイト等に上げない[14]学習も生成もローカル完結
R18法務(刑法175条・モザイク)既存ルール踏襲:無修正は頒布せず、トフィーさんがモザイク後処理して販売(feedback_r18_mosaic_legal)

第7章 30日プラン(akari/misako/hinata/rena/momo 実装)

Week 1:環境&1体目フル検証(akari)
kohya_ss導入確認 → akariのベストショット20枚選抜(非正面8枚含む)→ WD14自動キャプション+R18語補強 → 標準レシピ(dim8/1500step)で学習 → epoch比較・weight調整 → ComfyUIでGOLDEN組込み確認。ここで設定JSON・キャプション規則・データ構成をテンプレ化
Week 2:テンプレ適用で量産化(misako / hinata)
テンプレを流用し2体を学習。1体あたり実働1〜1.5hに圧縮できるか検証。揺れる顔はIPAdapter FaceID補助を試す。
Week 3:残り2体+ハイブリッド(rena / momo)
renaとmomoを学習。momoは新規キャラのため三面図ブートストラップから素体生成→データ化。複数キャラ併用時の干渉テスト(第9章)。
Week 4:96Vol本番投入&夜間キュー化
sd-scripts CLIで夜間連続学習キューを組み、追加キャラ/差分を放置学習。GOLDENパイプラインに5体LoRAを統合し本番Vol生成へ。

第8章 撤退ライン

第9章 落とし穴(致命チェックリスト)

  1. 三面図だけで学習→正面偏重でターンアラインがドリフト[4]。非正面6〜8枚必須。
  2. 枚数を増やせば良いと誤解→ノイジー50枚<クリーン10枚[4]。質>量。
  3. 固定したい属性をキャプションに書く→trigger語に吸着せず再現が不安定。固定属性は省く。
  4. Ponyキャラ学習でスコアタグを入れる→元画風が強く焼き付く[7]。キャラ学習では入れない。
  5. LRが高すぎ→コンセプトでなく画風を学ぶ[1]。epoch比較で手前採用。
  6. 複数LoRA併用の干渉:同方向のLoRA(cos≈1)は強く反発し過飽和・色破綻。逆方向(cos≈-1)は打ち消す[13]。weightを下げる/energy正規化ノード/キャラは原則1枚ずつ運用し、どうしても同一画面に複数出すならRegional/マージで分離。
  7. clip_skip未設定→Illustriousは2推奨[6]
  8. GOLDENサンプラを弄る→LoRAは追加だけにし、cfg6.0/dpmpp_2m/karras/30step/1024は変えない。
  9. 小物のドリフト→LoRAだけでは弱い。固定タグ併用+OneTrainerのmasked training[12]を検討。
  10. 無修正R18をオンライン学習に上げる→規約違反リスク[14]。ローカル完結。

第10章 既存資産活用 ― 数万枚の自己蒸留(self-distillation)

トフィーさん環境には oudou_r18 等で生成済みの数万枚がある。ここから各キャラのベストショットを選抜すれば、新規生成ゼロで良質な20枚データが即作れる。

ベストショット選抜基準(5項目)

  1. 顔・髪色・髪型が"理想形"に最も近い(キャラ定義md準拠)。
  2. 破綻なし(指/目/解剖学/断面図混入なし)。
  3. アングルが分散している(正面に偏らない・非正面を意識的に拾う)。
  4. 表情・脱衣段階が多様(無表情〜喘ぎ、着衣〜全裸を混ぜる)。
  5. 固定衣装/下着の描写が一貫している(差分は別管理)。
既存の三面図キャラ設定md(akari黒/misako栗茶/hinata明茶ボブ/rena金)と整合させれば、学習結果が設定からブレない。momoは新規のため三面図ブートストラップ(Phase0)から立ち上げる。

第11章 関連DR一覧(社内・役割分担)

DR役割本DRとの関係
DR_キャラ一貫性LoRA作成_完全手順_2026-05-23.html(97点)前回の基礎版本DRはその最新Web再裏取り+OneTrainer比較+momo追加+「30分検証」明確化版
DR_男キャラ一貫性_IPA_LoRA_2026-05-26.html男キャラ・IPA側FaceID併用知見を共有
DR_ComfyUI_LoRAトレーニング完全ガイド_2026.html汎用学習ガイド一般論の補完
DR_ComfyUILoRA最速学習CG量産ワークフロー_2026-04-28.html量産ワークフロー夜間キュー化の参考
DR_SDXLvsPonyvIllustrious品質比較2026_2026-04-28.htmlベース選定Illust/Pony使い分け根拠
三面図キャラ設定md先行で一貫性根治_2026-05-24(社内md)設定md先行本DRのデータ選抜基準と整合
自己採点 96/100(技術 25/25・再現性 24/25・裏取り 24/25・R18実務 23/25)。減点:① dim/alpha/lrの最適値は環境・データ依存で本DRは出発点提示に留まり1体目の実測が必須(再現性-1)。② Civitaiの詳細記事が login/mature wall で本文一次取得できずタイトル・検索抜粋ベースの引用が一部(裏取り-1)。③ 無修正R18データの学習可否は法務・規約の慎重判断が残る(R18実務-2)。
使用モデル:Grok-build-0.1(quick_check・コスト最適化)。推定コスト ¥約56($0.358)。

第12章 脚注(全URL・実在確認済)

  1. Civitai「LoRA training parameters guide for SDXL / Illustrious (on-site trainer)」: https://civitai.com/articles/21257/lora-training-parameters-guide-for-sdxl-illustrious-civitai-on-site-trainer
  2. Civitai「RTX 3060 and RTX 3090 TI SDXL LoRA Training Speeds」(3090Ti=1.23s/it・3060=2.4s/it 実測): https://civitai.com/articles/1530/rtx-3060-and-rtx-3090-ti-sdxl-lora-training-speeds
  3. Puget Systems「Stable Diffusion LoRA Training - Consumer GPU Analysis」(3090は1024をgrad-ckpt無しで完走・ckptで速度-22%): https://www.pugetsystems.com/labs/articles/stable-diffusion-lora-training-consumer-gpu-analysis/
  4. Apatero「AI Character Turnaround Sheet Generation Guide 2026」(SDXL15-30枚・非正面6-8枚・LoRA85-92% vs プロンプト65-75%・三面図のみ不可): https://apatero.com/blog/ai-character-turnaround-sheet-generation-guide-2026
  5. Civitai「XL Face Turn, Multi-View, Turnaround, Model Sheet, Character Design - SDXL LoRA」(三面図生成補助LoRA): https://civitai.com/models/889964/xl-face-turn-multi-view-turnaround-model-sheet-character-design
  6. DCAI「How to create an original character LoRA [Illustrious-XL Training]」(dim8/alpha1/lr1e-4/AdamW8bit/cosine/clip_skip2/1500-1600step/Prodigy): https://www.digitalcreativeai.net/en/post/original-character-lora-illustrious-character-training
  7. DCAI「How to create an original character LoRA [PonyV6 Training]」(Pony既定&Prodigy版dim32/alpha16/lr4e-4/epoch4・スコアタグ不使用推奨): https://www.digitalcreativeai.net/en/post/original-character-lora-pony-character-training
  8. Digital Zoom Studio「Training a Character LoRA with Kohya_ss + AUTOMATIC1111」(2026-03): https://digitalzoomstudio.net/2026/03/training-a-character-lora-with-kohya_ss-automatic1111/
  9. ViewComfy「Detailed Stable Diffusion LoRA training guide」: https://www.viewcomfy.com/blog/detailed-LoRA-training-guide-for-Stable-Diffusion
  10. Civitai「Lora Training Workflow [Pony - Illustrious XL]」(Danbooru+自然言語ハイブリッド入力): https://civitai.com/articles/10288/lora-training-workflow-pony-illustrious-xl
  11. DEV Community / Furkan Gözükara「OneTrainer Fine Tuning vs Kohya SS DreamBooth & Masked Training」: https://dev.to/furkangozukara/onetrainer-fine-tuning-vs-kohya-ss-dreambooth-huge-research-of-onetrainers-masked-training-4po7
  12. sanj.dev「LoRA Training 2025: Complete Step-by-Step Guide (Kohya + FLUX.1)」(kohya LoRA+・fused backward 24→10GB・alpha mask / OneTrainer ClipSeg-Rembg masked・EMA CPUオフロード): https://sanj.dev/post/lora-training-2025-ultimate-guide/
  13. Neurocanvas「Multi-LoRA Workflows in ComfyUI: Stacking & Composition」(干渉・energy正規化・cos類似度別の減衰・マージvsスタック): https://neurocanvas.net/blog/multi-lora-workflows-comfyui/
  14. Civitai Education「Using Civitai: the on-site LoRA trainer」(SDXL/Illust/Pony・SD1.5/SDXLは500 Buzz〜・NoobAI非対応・モデル別SFW優先注意): https://education.civitai.com/using-civitai-the-on-site-lora-trainer/
  15. Civitai「LoRA Training Guide: SDXL | Pony | Illustrious [AI-Toolkit]」: https://civitai.com/articles/26667/lora-training-guide-sdxl-or-pony-or-illustrious-ai-toolkit
  16. Hugging Face h94/IP-Adapter-FaceID(faceid-plusv2_sdxl・LoRA変種・顔ID埋め込み+CLIP・weight0.5-0.7・LoRAハイブリッド): https://huggingface.co/h94/IP-Adapter-FaceID / RunComfy FaceID Plus workflow: https://www.runcomfy.com/comfyui-workflows/create-consistent-characters-in-comfyui-with-ipadapter-faceid-plus