waiIllustriousSDXL v160 対応
キャラLoRA少枚数高精度学習法

Deep Research HTML - RTX 3090 Ti 24GB 環境専用

第1章: 結論(最初に断言)

即採用レシピ(Aレシピ - AdamW8bit安定版)

# kohya_ss 推奨config.toml (waiIllustriousSDXL_v160用)
pretrained_model_name_or_path = "D:/models/waiIllustriousSDXL_v160.safetensors"
output_dir = "D:/lora_output"
output_name = "chara_yukinosan_v1"

[dataset]
resolution = 1024
batch_size = 2

[[dataset.subsets]]
image_dir = "D:/train_data/yukinosan"
num_repeats = 5
caption_extension = ".txt"

[network_args]
network_module = "networks.lora"
network_dim = 32
network_alpha = 16

[optimizer_args]
optimizer_type = "AdamW8bit"
learning_rate = 3e-4
unet_lr = 3e-4
text_encoder_lr = 3e-5
lr_scheduler = "cosine_with_restarts"
lr_scheduler_num_cycles = 3
lr_warmup_steps = 150

[training_args]
max_train_steps = 1500
mixed_precision = "bf16"
gradient_checkpointing = false
cache_latents = true
cache_text_encoder_outputs = true
noise_offset = 0.03
min_snr_gamma = 5.0
debiased_estimation_loss = true
clip_skip = 0
no_half_vae = true
save_every_n_steps = 100
save_last_n_steps = 20
結論断言:
・最小実用枚数: 20枚(厳選・多様性確保済み)
・推奨枚数: 20〜25枚
・学習時間: 40〜60分 (batch_size=2, RTX3090Ti)
・LoRA適用weight: 0.75〜0.85
・Prodigy optimizer は Illustrious系で非推奨(動作不良報告多数 [S1])
・clip_skip は 0(SDXLはclip_skip=0が正しい・2は古い設定 [S2])

第2章: 市場・適用範囲

同一キャラの価値計算:

第3章: 競合・代替手段TOP5

手法顔一貫性準備コストVRAM弱点
キャラLoRA(本手法)★★★★★60分/体24GB初期学習コスト
IPAdapter + FaceID★★★☆☆5分8GB3シーン目で崩れる
ControlNet Reference★★★☆☆なし8GB体型まで固定できない
DreamBooth★★★★☆2〜3時間24GB+過学習しやすい
Seed固定+プロンプト固定★★☆☆☆なしなし長期量産で破綻

第4章: 技術スタック(詳細)

4.1 waiIllustrious特有の注意点(既存DR非掲載の新情報)

Illustrious/waiIllustrious系はepsilon-prediction(v-predではない)
→ 以下のフラグは不要・設定するとおかしくなる:
・v_parameterization: 不要
・zero_terminal_snr: 不要
・scale_v_pred_loss_like_noise_pred: 不要

必須フラグ(忘れると品質低下):

optimizer選択:

4.2 ハイパーパラメータ詳解

パラメータ推奨値理由ソース
network_dim32品質とファイルサイズのバランス[S2][S7]
network_alpha16 (dim×0.5)標準比率[S2]
lr_unet3e-4キャラ特徴の強い学習[S1][S7]
lr_te3e-5 (unet×0.1)TE過学習防止[S1][S7]
noise_offset0.03Illustriousベース値に合わせる[S2][S13]
min_snr_gamma5.0タイムステップ重み付け最適値[S11][S18]
batch_size23090Ti VRAMに余裕・勾配安定
total_steps1500〜2000収束とやり直し余裕[S7][S4]
save_every100stepsベストepoch選択のため

4.3 ステップ数計算式

total_steps = 画像枚数 × num_repeats × max_epochs

例A: 20枚 × 5repeats × 15epoch = 1500steps
例B: 25枚 × 4repeats × 20epoch = 2000steps
例C: 20枚 × 3repeats × 25epoch = 1500steps

目安: 2000stepsが上限ライン。超えると過学習リスク増大。

第5章: コスト試算

5.1 1体あたりの学習コスト(RTX3090Ti基準)

項目時間/コスト
データセット生成(多様性確保)30〜60分
画像選定・キャプション作業15〜30分
kohya_ss 学習実行(1500steps, batch2)40〜60分
検証(エポック比較・テスト)15〜30分
合計 1体あたり100〜180分(約2〜3時間)

5.2 電力・コスト試算

5.3 ROI計算(FANZA販売ベース)

第6章: リスク

6.1 AI生成画像データセット固有のリスクと対策

リスク1: スタイル固着(最大のリスク)
原因: 同一モデル・同一タグで生成すると画像が均一→スタイルが焼き込まれる
症状: LoRA適用時にwaiIllustriousの特定の「癖」まで学習してしまう
対策: 多シード(最低20 seeds)で生成 / CFG値を5〜10の範囲で変える / サンプラーをdpmpp_2m/euler/dpmpp_sdeで混ぜる / 背景を意図的に多様化

リスク2: 過学習(ポーズ固定化)
原因: 同じポーズの画像が多すぎる・steps数が多すぎる
症状: 全ての生成で同じポーズになる / トリガーなしでキャラが出る
対策: 多様なポーズ・early stopping(epoch比較で最良point選択)

リスク3: 顔崩れ(学習失敗)
原因: 学習データに崩れた顔・别キャラ混入
対策: 全素材を1024pxグリッドで目視確認してから学習

6.2 過学習の確認方法

テスト1: トリガーワードなし生成
→ キャラが出てきたら: スタイル汚染=過学習
→ 通常の生成結果なら: 正常

テスト2: 学習時と全く違うプロンプト
→ 硬直した同じポーズになったら: ポーズ過学習
→ 多様な構図が出れば: 正常

テスト3: LoRA strength段階テスト (0.5 / 0.7 / 0.9 / 1.1)
→ 0.9以上でアーティファクト多発: 学習が強すぎ→epoch戻す
→ 0.7で安定: 理想的

第7章: 30日実行プラン

日程タスク成果物
Day0〜1fanza3_massの過去Best生成物から素材候補50枚収集候補リスト
Day2〜3多角度・多表情・多シード補完生成(不足分補強)70枚候補
Day3PIL/画像グリッドで厳選→20〜25枚に絞り込みtrain_data/chara/
Day4WD14 Tagger実行→キャプション編集(固有特徴タグ除去・トリガー追加).txt全件
Day5Aレシピで初回学習(1500steps, 100step毎ckpt保存)ckpt×15本
Day6epoch5/10/15のcheckpoint比較・品質検証3テスト実行best LoRA確定
Day7〜9第1作品でLoRA実戦投入・weight0.75〜0.85で調整Vol001
Day10〜3010作品量産(同一LoRA再利用・作品ごとに衣装/シチュ変える)Vol001〜010

第8章: 撤退ライン

即撤退条件(再学習を検討)
・epoch15終了時点で顔一致率が50%未満
・トリガーなし生成でもキャラが出現(スタイル汚染)
・LoRA strength 0.8で画像が著しく崩れる
学習データの見直しライン
・連続3epoch改善なし → 学習データ多様性不足
・全体的に同じ表情・ポーズ固定 → ポーズ多様性不足
・特定の服装・背景が焼き込まれる → キャプション修正要
設定変更ライン(撤退ではなく調整)
・lr_unet を 3e-4 → 2e-4 に下げる(学習が強すぎる場合)
・dim を 32 → 16 に下げる(ファイルサイズ・副作用軽減)
・total_steps を 1500 → 1000 に下げる(過学習対策)

第9章: 落とし穴10選

  1. 三面図だけで学習する → アクション・エロシーンで崩壊。多様ポーズ必須
  2. 髪色・目の色をキャプションに書く → 推論時に変更不可になる。固有特徴は書かない
  3. Prodigy optimizerを使う → Illustrious系で「burn」報告多数 [S1][S2]
  4. clip_skip=2 → SD1.5向け設定。SDXL/Illustriousはclip_skip=0
  5. noise_offsetを0.1以上に → Illustrious baseは0.03。0.1以上は色が過剰変化
  6. 同一タグ・同一シードで生成した画像を使う → スタイル固着の元凶
  7. 顔が隠れている/崩れている画像を混ぜる → 顔特徴の学習阻害
  8. 複数キャラを1LoRAで同時学習 → 相互干渉で精度低下・個別学習が正解
  9. epoch20以降まで粘る → 2000stepsが現実的上限・超えると過学習一直線
  10. 検証テストを省略して即量産 → 品質保証なしで量産すると全作品に悪影響

第10章: 既存資産活用

fanza3_massプロジェクトの過去生成物をデータセットに変換する手順

ステップ1: 素材収集

対象パス: D:\projects\fanza3_mass\ComfyUI\output\oudou_r18_2026-05-20\<vol>_v160
対象: 各Volのbest画像(品質ゲート通過済み = gate.json評価3.8以上)
目標: 各Volume 2〜3枚 × 10 Volume = 20〜30枚の候補

ステップ2: 品質フィルタリング

# PIL グリッド確認スクリプト例
from PIL import Image
import glob

imgs = glob.glob(r"D:\train_candidates\*.png")
grid_size = (5, 4)  # 20枚グリッド
# 目視で: 同一キャラ感あるか / 顔崩れないか / 多様性あるか を確認

ステップ3: 多様性補完生成

不足している角度・表情を追加生成(目標: 5アングル × 4表情以上)

必須確認アングル:
- 正面 / 斜め45度左 / 横 / やや上から / やや下から
必須表情:
- neutral / smile / blush / ahegao(目的がR18なら必須)

ステップ4: キャプション作成

ファイル名: yukinosan_001.txt
内容例: "yukinosan, standing, smile, white background, full body"
       "yukinosan, sitting, ahegao, bedroom, bust shot"
       "yukinosan, lying, blush, white background, face close-up"

禁止タグ(固有特徴・キャプションに書かない):
× blonde hair / blue eyes / large breasts / default outfit name

第11章: 関連DR一覧

DR名主要テーマ本DRとの差別化
DR_lora_hyperparam_best_2026-06-02ハイパラ詳解・2レシピ本DRは少枚数・生成画像特化
DR_LoRA無し一貫性最大化_応急決定版_2026-05-30LoRA不要の応急策本DRはLoRA本命
DR_LoRA学習高速化_ファクトリー効率_2026-05-31最速学習本DRは精度重視
DR_LoRAキャラでエロ漫画化_自動パイプライン_2026-05-31パイプライン本DRは学習法詳細
DR_LoRA量産高速化×一貫性_2026-06-01量産効率本DRは1体の品質
DR_LoRA_キャラ学習失敗パターン_2026-06-02失敗回避本DRは正解フロー
DR_lora_factory_99char_architecture_2026-06-0299体工場設計本DRは少枚数スモール

第12章: 脚注(全20ソース・実URL)

[S1] https://civitai.com/articles/9148/illustrious-lora-training-discussion-29052025
[S2] https://civitai.com/articles/21257/lora-training-parameters-guide-for-sdxl-illustrious-civitai-on-site-trainer
[S3] https://www.digitalcreativeai.net/en/post/original-character-lora-illustrious-character-training
[S4] https://night-dev.com/en/blog/ai-toolkit-illustrious-sdxl/
[S5] https://comfyui.nomadoor.net/en/notes/ai-toolkit-sdxl-lora-training/
[S6] https://civitai.com/models/850658/illustrious-lora-training-guide
[S7] https://www.seaart.ai/articleDetail/cvdakg5e878c73a5mbrg
[S8] https://apatero.com/blog/anime-character-consistency-complete-guide-2025
[S9] https://apatero.com/blog/training-loras-consistent-ai-influencer-characters-comfyui-2025
[S10] https://civitai.com/articles/8370/nanashianons-cool-lora-training-guide-for-attractive-people
[S11] https://civitai.com/articles/6173/demystifying-snr-min-snr-debiased-estimation-and-ip-noise-gamma
[S12] https://github.com/bmaltais/kohya_ss/discussions/3044
[S13] https://civitai.com/articles/2524/sdxl-controlling-sdxl-brightness-contrast-and-color-noise-offset-and-vectorscope
[S14] https://www.pugetsystems.com/labs/articles/stable-diffusion-lora-training-consumer-gpu-analysis/
[S15] https://apatero.com/blog/ultimate-guide-lora-training-2025
[S16] https://arxiv.org/html/2505.11703v1
[S17] https://medium.com/@guillaume.bieler/a-comprehensive-guide-to-training-a-stable-diffusion-xl-lora-optimal-settings-dataset-building-844113a6d5b3
[S18] https://huggingface.co/blog/sdxl_lora_advanced_script
[S19] https://www.viewcomfy.com/blog/detailed-LoRA-training-guide-for-Stable-Diffusion
[S20] https://github.com/kohya-ss/sd-scripts/discussions/294