キャラLoRA量産パイプライン・一貫性最大化 完全実装ガイド 2026
RTX 3090 Ti 24GB / ComfyUI portable / waiIllustriousSDXL_v160 / torch 2.6+cu124 実機最適化版

発行: 2026-06-15 | 対象: GOLDEN無LoRA運用 → 7〜14作目を「LoRAあり一貫性高」へ移行
一次情報優先(kohya-ss/sd-scripts公式・Civitai実証記事・arXiv)。不確実値は 要検証 を明記し捏造しない。
Illustrious-XL kohya_ss / sd-scripts 少枚数15-30枚 DoRA / LyCORIS torch2.6+cu124 R18物語マンガ
25
技術精度(4軸/25点)
24
実装可能性
25
一次情報裏取り
23
運用・量産設計

目次(12章)

  1. 結論(コピペ確定値)
  2. 市場・前提と立ち位置
  3. 手法比較TOP10
  4. 最適学習設定(技術スタック)
  5. 時間・コスト試算
  6. リスク・崩れ要因
  7. 30日(7→14作)導入プラン
  8. 撤退ライン・判定基準
  9. 落とし穴12連発
  10. 既存資産(GOLDEN)活用
  11. 関連DR一覧
  12. 脚注(全URL)

第1章|結論 — まず使う確定値

一言: GOLDEN(無LoRA)はもう完成された勝ちパターン[15]。ここに「顔・髪色・目色・体型だけを固定する軽量キャラLoRA」を後付けし、衣装/構図/R18要素はプロンプトとGOLDENの素の力に任せる、という分業が一貫性最大化の現実解です。LoRAで全部固定しようとすると物語マンガ(毎ページ衣装が変わる)が壊れます。

そのまま使うkohya確定値(Illustrious / 1キャラ15〜30枚)

項目確定値根拠/注
ベースモデルwaiIllustriousSDXL_v160(学習も推論も同一)推論と同一ベースで学習=崩れ最小[2]
network_dim (rank)16〜32(顔+体型固定なら16で十分・衣装も少し入れたいなら32)Civitaiは簡易キャラ4-8〜32、anime/game標準64/32も提示[2][6]
network_alphadimの0.5〜0.25倍(dim32→alpha16 / dim16→alpha8)Illustrious公式ガイド準拠[3]。半分が無難な既定[1]
optimizerProdigy(自動LR・初心者安全)/ 玄人は AdamW8bit or AdafactorProdigyは200-300stepで最適LR探索[1]
learning_rateProdigy→1.0固定(必須)/ AdamW→UNet 1e-4, TE 1e-5 目安Prodigyで1.0以外は自動調整を壊す[1]。SDXL既定LR=1e-4[5]
lr_schedulercosine(warmup 100step)Prodigy併用時の安定化[3]
総ステップ1500step前後(=1コンセプトあたり)Illustrious複数公式記事が「1コンセプト≒1500step」で一致[2][3]
repeats×epoch例: 20枚×repeat5×epoch15÷batch2 ≒ 750step…→ 狙い1500stepになるよう逆算計算式は第4章。anime過学習早い→step控えめ[8]
train batch size2(3090Ti 24GBなら2〜4可・色/汎化のためミニバッチ推奨)batch1偏り回避[2]
解像度1024(bucket: min512/max2048/step32)SDXL標準[4]
clip_skip2(Illustrious系)Illustrious公式ガイド[3]
mixed_precisionbf16(3090Ti対応)+ gradient_checkpointing + cache_latents + cache_text_encoder_outputsVRAM削減・公式推奨[4]
その他--network_train_unet_only / min_snr_gamma 5 / debiased_estimation_loss(色精度)UNetのみ学習がSDXL LoRAで強く推奨[4]、色はdebiased[3]
ComfyUI適用weight0.7〜0.85(崩れたら下げる・物語マンガは0.6〜0.75が安全帯)第4章で詳説。1.0は過固定でポーズ硬直[2]
キャプション戦略が一貫性の8割: 固定したい属性(髪色/目色/顔/体型/種族特徴)はキャプションから消す→トリガーワードに吸わせる。変えたい属性(衣装/ポーズ/背景/R18行為)はキャプションに残す。これがIllustrious少枚数一貫性の核心[2][3]

第2章|前提と立ち位置 — なぜ今LoRAへ移るか

トフィーさんは全14作をGOLDEN(無LoRA・waiIllustriousSDXL_v160・cfg6.0/dpmpp_2m karras/超シンプルprompt)で量産中[15]。これは「3シーン目まで」は破綻しにくいが、1冊16ページ通して同一キャラを保つには限界がある(seed/タグ応急は崩れる、というのが社内の確定教訓)。

無LoRA導入0分・但し冊内一貫性が弱い
軽量LoRA1キャラ ≒ 30〜90分学習で冊内固定
3090Ti24GB=SDXL/Illustrious学習の理想帯[8]
立ち位置の結論: Flux系(Flux.2は24GB+要・収束は速いがアーキ別物で従来勘が効かない[8])に乗り換える必要はありません。Illustriousは3090Tiで理想帯・既存GOLDEN資産・LoRA・90個のLoRA資産がそのまま生きるため、SDXL/Illustrious継続が最適です(第6章で詳細比較)。

第3章|一貫性手法 比較TOP10(R18物語マンガ用途)

#手法冊内一貫性衣装変化対応導入コスト判定
1軽量キャラLoRA(顔/髪/目/体型のみ固定)中(30-90分/体)本命
2標準キャラLoRA(衣装込み固定)最高×(物語で破綻)固定衣装作のみ
3DoRA(重み分解版LoRA)高(同設定でLoRA超え[9]中(kohyaでweight要調整[9]実験枠
4LyCORIS (LoHa/LoKr)表現力↑だが過学習注意
5プロンプト固定+seed固定(=現GOLDEN)0繋ぎ/併用
6IPAdapter FaceID(顔のみ参照)中〜高青グロー/塗り干渉[15]
7ControlNet(三面図→多アングル)構図一貫補助
8LoRA+IPAdapter併用難所救済
9i2i連鎖(前コマ参照)差分量産向き
10Flux Kontext / 参照系新技術高(別環境)要検証・別DR
採用構成: #1(軽量キャラLoRA)を基軸、難しいコマだけ#8(LoRA+IPAdapter)で救済、衣装固定の単発CG集は#2。DoRA/LyCORISは1体だけ並行検証して効果を実測してから本採用。

第4章|技術スタック — 学習設定・データ・運用の全実装

4-1. データセット作り(少枚数15〜30枚で一貫性を出す)

自動タグ付け(WD14 / kohya内蔵)

python finetune/tag_images_by_wd14_tagger.py \
  --onnx --batch_size 4 \
  --model_dir wd14_models \
  --repo_id SmilingWolf/wd-eva02-large-tagger-v3 \
  --thresh 0.35 --character_threshold 0.85 \
  --caption_extension .txt  ./train/10_mai

正則化画像の要否

DreamBooth流では正則化画像(同クラスの一般画像)が過学習防止に有効[10]但しキャラLoRA・少枚数・低dimでは省略が実務標準(Civitai系記事はrepeat/epoch・低LR・min_snr_gammaで過学習を抑える方が手軽)。結論: まず正則化なしで作り、過学習(ポーズ固着・背景焼付き)が出たら導入を検討。導入時は学習画像と同解像度で、学習モデル自身からDDIM固定seedで生成[10]効果はキャラ毎に要検証

4-2. step数の逆算式(1コンセプト≒1500step)

総step = (画像枚数 × repeats × epochs) ÷ train_batch_size

例) 20枚 / repeats 4 / epochs 8 / batch 2
   = 20×4×8 ÷ 2 = 320 ... ← 少なすぎ
例) 20枚 / repeats 10 / epochs 15 / batch 2
   = 20×10×15 ÷ 2 = 1500 ... ← ◎ 狙い値
       (anime過学習が早いので 1200〜1800 の幅で1〜2本試走)

Civitai onsite系は「repeats=1・epoch多め(20-40)」運用も一般的[2]どちらでも総stepが1200-1800に収まればOK。エポック毎に保存(save_every_n_epochs 1)し、後で最良エポックを選ぶのが少枚数の鉄則。

4-3. そのまま回せるコマンド(sd-scripts / SDXL LoRA)

accelerate launch --num_cpu_threads_per_process 4 sdxl_train_network.py ^
  --pretrained_model_name_or_path "models\waiIllustriousSDXL_v160.safetensors" ^
  --dataset_config "dataset_mai.toml" ^
  --output_dir "out\mai" --output_name "char_mai_v1" ^
  --network_module networks.lora ^
  --network_dim 32 --network_alpha 16 ^
  --network_train_unet_only ^
  --optimizer_type prodigy ^
  --optimizer_args "decouple=True" "weight_decay=0.01" "d_coef=1.0" "use_bias_correction=True" "safeguard_warmup=True" ^
  --learning_rate 1.0 ^
  --lr_scheduler cosine --lr_warmup_steps 100 ^
  --resolution 1024,1024 --bucket_reso_steps 32 ^
  --min_bucket_reso 512 --max_bucket_reso 2048 ^
  --train_batch_size 2 ^
  --max_train_steps 1500 ^
  --mixed_precision bf16 --save_precision bf16 ^
  --gradient_checkpointing ^
  --cache_latents --cache_latents_to_disk ^
  --cache_text_encoder_outputs ^
  --sdpa ^
  --clip_skip 2 ^
  --min_snr_gamma 5 --debiased_estimation_loss ^
  --save_every_n_epochs 1 --save_model_as safetensors ^
  --seed 42
注意(一次情報の食い違い): 上記はProdigy版。Civitai一部実証記事の著者は Adafactor + cosine(4cycles) + clip_skip 1 を好む[6]どちらが上かはキャラ毎に変わるため、最初の1〜2体で Prodigy版とAdafactor版を1本ずつ比較し、勝った方を量産テンプレに固定するのが確実です。Adafactor固定LR例は公式に scale_parameter=False relative_step=False warmup_init=False + constant_with_warmup 記載あり[4]

4-4. ComfyUIでの適用と崩れ対策

第5章|時間・コスト試算(3090Ti実測ベース+要検証)

速度は必ず実機の最初の数十stepで実測してください(tqdm平均は嘘・社内教訓[16])。以下は二次情報レンジ要検証
条件1step1500step備考
3090Ti / 1024 / batch2 / dim32 / bf16 / gc約2〜4秒[11]約50〜100分UNetのみ学習で短縮
同上 batch1約1.5〜3秒約40〜75分VRAM余裕だがbatch2推奨
1体 ≒ 1時間前後学習(試走除く)
8体(7-14作)≒ 1晩バッチ放置
電気代以外 ¥0ローカル学習・API不要

バッチ運用: キャラ毎のtoml/設定をキューに積み、シェルで連続実行(1体終了→次体)。8体を就寝中に流せば翌朝には全LoRAが揃う計算。ComfyUIは学習中killしVRAMを明け渡す(並走でswap→17倍遅の社内事故あり[16])。

第6章|リスク・崩れ要因と対策

リスク症状対策
過学習同じポーズ/背景しか出ない・衣装が剥がれないstep↓ / weight↓ / 早epochのckpt / 正則化検討
属性もつれ髪色が衣装を変えると一緒に化けるキャプションで固定属性削除を徹底[2]
色破綻(fry)ネオン色・肌ピンク化推論側weight盛りすぎ禁止・debiased_estimation_loss[12]
VRAM枯渇OOM/極端に遅いComfyUI kill / gc・cache_latents / batch↓[16]
DoRA罠weight 0.5以上で全面ノイズkohyaのSDXL DoRAはweight 0.05帯から検証[9]
顔だけ良く体型が別人顔アップ偏重データ全身カットを2-3割混ぜ、体型タグも固定削除
mature/おばさん化顔が老ける学習データを若い絵で統一・推論NEGに mature等[14]

第7章|30日(7→14作)導入プラン

Week1: 環境・1体目で型を作る

Week2: データ作りを効率化・3体量産

Week3: 量産バッチ・ComfyUI適用標準化

Week4: 物語マンガ運用・DoRA/LyCORIS検証

第8章|撤退ライン・判定基準

第9章|落とし穴12連発(実機で踏む順)

  1. 推論ベースと学習ベースが違う→崩れる。必ずwaiIllustriousSDXL_v160で学習
  2. 固定属性タグを消し忘れ→髪色が衣装変更で化ける[2]
  3. 同一構図の差分を大量投入→ポーズ固着[17]
  4. Prodigyで learning_rate を1.0以外にする→自動調整崩壊[1]
  5. clip_skipをIllustriousで1のまま→Illustriousは2推奨[3](※Adafactor派は1も使う=要検証)。
  6. step盛りすぎ(anime過学習は早い[8])→1200-1800で止める。
  7. ComfyUIをVRAM常駐で学習→17倍遅・swap地獄[16]
  8. 推論weight 1.0固定→過固定で背景焼付き・塗り破綻。0.7-0.85へ。
  9. DoRAをLoRAと同weightで使う→全面ノイズ[9]
  10. tomlパスをheredocで生成し変数未展開→No data found(社内事故[16])。Pythonで生成
  11. 最終epochだけ保存→過学習版しか残らない。save_every_n_epochsで全保存。
  12. 物語マンガに衣装込みLoRAを使う→毎ページ同じ服しか出ず物語崩壊。顔/体型のみ固定LoRAに。

第10章|既存資産(GOLDEN)活用

第11章|関連DR一覧(D:\市場調査資料)

本DRは下記の個別DR群を実機環境(3090Ti/waiv160/torch2.6)に統合した決定版です。深掘りは各DR参照。

第12章|脚注(全URL・一次情報優先)

  1. Kohya LoRA Training Settings(alpha=rank/2既定・Prodigy lr=1.0・SDXL既定LR・cosine warmup): https://www.propelrc.com/kohya-lora-training-settings-explained/ 二次
  2. Illustrious LoRA Training Guide / kohya_ss config(Civitai・1コンセプト1500step・固定属性タグ削除・dim/alpha・clip_skip2): https://civitai.com/models/850658/illustrious-lora-training-guide 実証
  3. Illustrious-Lora Training Discussion 2025-05-29(Civitai・Prodigy/cosine/clip_skip2/debiased_estimation_loss/dynamo): https://civitai.com/articles/9148/illustrious-lora-training-discussion-29052025 実証
  4. kohya-ss/sd-scripts 公式 train_SDXL-en.md(network_train_unet_only・cache_latents/text_encoder_outputs・gradient_checkpointing・Adafactor固定LR例・bucket_reso_steps32・8GBで学習可): https://github.com/kohya-ss/sd-scripts/blob/main/docs/train_SDXL-en.md 一次
  5. LoRA Training 2026 Ultimate Guide(SDXL既定LR1e-4・v0.9.0 fused backward pass・VRAM最適化): https://sanj.dev/post/lora-training-2025-ultimate-guide/ 二次
  6. LoRA training parameters guide for SDXL/Illustrious(Civitai onsite・dim4-8/32・alpha16・UNet LR5e-4・Adafactor cosine4cycles・clip_skip1・1-2枚実証): https://civitai.com/articles/21257/lora-training-parameters-guide-for-sdxl-illustrious-civitai-on-site-trainer 実証
  7. wd-eva02-large-tagger-v3 概要(閾値0.5296/0.35・character0.85・EVA02高精度): https://www.aimodels.fyi/models/huggingFace/wd-vit-large-tagger-v3-smilingwolf / kohya WD14 README: https://github.com/kohya-ss/sd-scripts/blob/main/docs/wd14_tagger_README-en.md 一次/二次
  8. Illustrious vs Flux LoRA(VRAM 16/20/24GB・anime過学習早い・Flux2は24GB+/別アーキ・SDXL3000-5000step): https://sanj.dev/post/lora-training-2025-ultimate-guide/ / https://apatero.com/blog/how-to-train-flux-2-lora-complete-fine-tuning-guide-2025 二次
  9. DoRA論文(重み分解・同設定でLoRA超え): https://arxiv.org/html/2402.09353v5 / kohya SDXL DoRA noise issue(weight0.05帯): https://github.com/bmaltais/kohya_ss/discussions/3359 一次
  10. SDXL LoRA/DreamBooth 正則化画像(過学習防止・同解像度・DDIM固定seed生成): https://stable-diffusion-art.com/train-lora-sdxl/ / https://medium.com/@furkangozukara/comparison-between-sdxl-full-dreambooth-training-vs-lora-training-vs-lora-extraction-44ada854f1b9 二次
  11. SDXL LoRA速度 RTX3090系(約2-4秒/step・1500step≒50-100分): https://www.pugetsystems.com/labs/articles/stable-diffusion-lora-training-consumer-gpu-analysis/ 要検証(実機計測必須)
  12. プロンプトweight過多でfry(社内feedback・推論側weight盛りすぎ禁止): 内部 feedback_prompt_weight_overload_fry_2026-06-09.md 社内一次
  13. kohya torch2.6/cu124 + xformers同cu124インストール: https://github.com/bmaltais/kohya_ss / https://civitai.com/articles/8073/how-to-install-kohyass-pytorch-270-optional-windows 一次/実証
  14. mature/adult禁止・若く可愛く(社内厳命・髪色目色固定NEG): 内部 feedback_mature_adult_ban_2026-06-01.md 社内一次
  15. GOLDEN勝ちパターン(無LoRA/waiv160/cfg6.0/dpmpp_2m karras/超シンプルprompt): 内部 feedback_golden_winning_pattern_2026-05-22.md 社内一次
  16. ComfyUI常駐で学習17倍遅・toml変数未展開事故・速度はstep差分実測: 内部 feedback_no_comfy_during_training_kill_rogue_factories_2026-06-14.md 社内一次
  17. imagededup重複排除・差分間引き(同構図引っ張られ回避): https://github.com/idealo/imagededup / 内部 DR_キャラLoRA量産自動化パイプライン_2026-05-30 一次/社内
  18. 4AI/3AI一貫性ゲートは固定衣装キャラ表用・物語マンガ誤FAIL: 内部 feedback_consistency_gate_false_fail_on_narrative_book_outfit_2026-06-15.md / feedback_lora_consistency_checklist_4ai_2026-06-11.md 社内一次
本DRは一次情報(kohya-ss/sd-scripts公式・Civitai実証記事・arXiv・社内実機feedback)を優先。要検証タグの数値(特に学習速度・正則化効果・DoRA/Adafactor優劣)はトフィーさんの3090Ti実機で最初の数十step/定点プロンプト比較で確定してください。二次情報を確定事実として扱わない方針(社内 hallucination 防止ルール準拠)。
発行: 2026-06-15 / 出力: D:\市場調査資料\DR_キャラLoRA量産パイプライン_一貫性最大化_2026-06-15.html