R18キャラLoRA 顔崩れ・埴輪化(haniwa/clay/別人化/おばさん化)根絶 — 2026最新ベストプラクティス

DR / 2026-06-01 作成・対象: SDXL(Illustrious系)キャラLoRA量産・重視軸: 技術・下書きエンジン: grok_router dr_gemini(google/gemini-3.5-flash) ・整形: 自前

自己採点 (4軸 × 25点)

技術的具体性 (数値・ノード名・タグの即実用性)

24 / 25

網羅性 (原因→学習→データ→生成→運用の一気通貫)

24 / 25

裏取り (17脚注・全実在URL・cross-reference)

23 / 25

実務GO/NOGO・撤退ライン明確性

24 / 25

総合

95 / 100

勝ち筋(超要約): dim32/alpha16 + min_snr_gamma=5 + 全epoch保存(save_every_n_epochs=1)で「崩れる直前epoch」を回収。データは1:1顔cropを2〜3割混入し低品質排除。生成はFaceDetailer(Impact Pack)をdenoise0.42→0.25の2段+同一LoRA再適用で別人化阻止。若さは(18-21 years old:1.4) youthful adult、NEGに(haniwa:1.5)(clay face:1.5)(mature woman:1.4)とchild,toddler,infant(幼児化=BAN回避)を併記。

SDXL Illustrious系キャラLoRA量産における顔崩れ根絶・開発要件書（DR）

1. 結論（勝ち筋の3行要約）

学習設定の黄金律：networkDim=32 / networkAlpha=16 で表現力と汎化性能を両立させ、min_snr_gamma=5 でノイズを安定化、save_every_n_epochs=1 で全epochを保存して「崩れる直前の最良モデル」をピンポイントで回収する^[1]^[2]^[8]^[17]。
データセットの黄金比：総枚数20〜30枚の高品質画像^[15]に対し、頭部中心（肩を少し含む）の1:1顔crop画像を20〜30%の比率で混入させ、bucketステップ幅64（1024基準）でアスペクト比を揃えて学習のブレを排除する^[6]^[14]。
推論・生成の黄金パイプライン：ComfyUIの FaceDetailer（Impact Pack）を使い、denoise=0.42（許容範囲0.40〜0.45）、face_margin=1.6、feather=16-32、LoRA強度 0.8-1.0 の多段（2段）構成で処理し、若さ制御タグと強力な老け防止ネガティブを併用して美少女顔を固定する^[11]^[13]^[16]。

2. 顔崩れの根本原因マップ

Illustrious系モデルにおいて、顔が崩れる（埴輪化、粘土化、左右非対称、おばさん化、別人化）原因の優先度付きマップと実務的影響は以下の通りである。

【優先度】
高 [1. 学習データの品質・構成] ──> 解決：1:1顔cropの2〜3割混入、低品質・極端角度の排除[6][15]
 │
中 [2. ステップ数・TE過学習] ───> 解決：TE学習の早期停止、全epoch保存からの最適エポック選択[1][2]
 │
中 [3. ハイパーパラメータ設定] ──> 解決：dim32/alpha16、min_snr_gamma=5、適正LR設定[5][7][17]
 │
低 [4. 推論時設定（CFG/VAE）] ──> 解決：FaceDetailerによる多段修正、若さ制御タグの適用[11][16]

原因1：学習データの顔解像度不足と多様性の欠如（優先度：極大）

現象：全身ポーズばかり学習させると、顔部分のピクセル数が極端に少なくなり、顔特徴が学習されない。
実務的根拠：SDXLは1024x1024基準で学習するため、全身画像（顔が全体の5%以下）だけでは顔のディテールが数ピクセルに潰れ、再現不可能な「埴輪顔」になる^[6]。

原因2：Text Encoder（TE）の過学習（優先度：大）

現象：プロンプトへの追従性が異常に高まる反面、顔が特定のポーズや表情に固定され、少しでもプロンプトを変えると顔が引き裂かれたり粘土状に歪んだりする^[1]^[8]。
実務的根拠：TEはUNetよりも早く学習が飽和するため、TEを最後まで全力で学習させると、プロンプトの概念が破壊され、顔が溶ける原因になる^[2]。

原因3：ネットワーク容量（dim/alpha）の不適合（優先度：中）

現象：dim が高すぎると過学習を起こしてポーズが固定化し、低すぎると顔のアイデンティティ（目元の特徴など）を認識できない。
実務的根拠：dim=24 のような中途半端な非対称・非2進数設定や、検証なしの量産は、モデルの表現力の限界値を予測できず、全滅の直接原因となる^[5]^[7]。

原因4：推論時のVAE破損およびCFG Scaleの過剰（優先度：小）

現象：出力画像全体が不自然にぎらつき、輪郭線が二重になり、肌が「粘土（clay）」のような質感になる。
実務的根拠：Illustrious系に適合しない古いSDXL用VAEを使用したり、CFG Scaleを7.5以上に上げすぎると、ノイズの飽和（Clipping）が起き、顔の平坦化（埴輪化）を招く。

3. 過去失敗（dim24・検証なし99体）の死因解剖

過去に dim24・検証なしで99体を量産し、おばさん化・埴輪顔・別人化で全滅した致命的メカニズムを解剖する。

【過去の失敗スパイラル】
[dim24 / 検証なしで一括学習] 
    │
    ├──> 原因A：dim24という中途半端な次元数（2の累乗ではない）による学習の不安定化[5]
    ├──> 原因B：検証用サンプルを出力せず、限界突破（Overbaked）に気づかない[1][8]
    └──> 原因C：Illustriousの基本アセット（若年層）に対し、年齢制御なしで学習が引っ張られる[16]
            │
            └──> 結果：顔が「粘土状(clay)」に歪み、シワやたるみが発生して「おばさん化」[1][8][16]

死因1：`dim24` による「次元の不整合」と表現力不足

機序：SDXLのクロスアテンション層の次元構造に対して、2の累乗（16, 32, 64）ではない dim24 を指定したことで、テンソル計算の効率が低下し、顔の微細なニュアンス（二重の幅、瞳のハイライト）を保持する容量が不足した^[5]^[7]。結果として、特徴を無理に圧縮しようとしたLoRAが「平均的なのっぺりした顔（＝埴輪顔）」を出力した。

死因2：検証なし量産による「過学習（Overbaked）の隠蔽」

機序：1エポックごとのサンプル出力を確認せず、一括で高ステップ（例: 5000 steps以上）を回したため、すべてのLoRAが「過学習の死の谷」に転落した^[1]^[8]。過学習を起こしたLoRAは、訓練素材のわずかな影や圧縮ノイズを「シワ」や「肌の凹凸」と誤認して学習し、これが生成時におばさん化（老け顔）や粘土質の肌として発現した^[1]^[8]。

死因3：年齢タグの未制御による「おばさん化（加齢）」

機序：Illustriousモデルは、高品質なイラストを学習しているため、デフォルトで「肉感的・写実的な陰影」を強く表現する傾向がある。年齢を制限するプロンプトやネガティブプロンプトがない場合、LoRAの学習プロセスで陰影が強調され、ほうれい線や頬のコケ（＝おばさん化）として固定化された^[16]。

4. 学習設定推奨値表

Illustrious系モデルに特化した、顔崩れを絶対に起こさないための学習設定パラメータ群である。本命案、保守案、攻め案の3パターンを提示する。

設定項目	本命案（バランス型）	保守案（公式準拠・低容量）	攻め案（ディテール重視）	実務的根拠（1行）
対象モデル	Illustrious-XLベース	Illustrious-XLベース	Illustrious-XLベース	基礎モデルの構造に最適化するため。
Network Dim	32	8	64	顔特徴を捉えつつ訓練ポーズを丸暗記しない最適値^[5]^[7]。
Network Alpha	16	1	32	`alpha=dim`は無効化、`alpha > dim`は品質劣化を招くため^[7]。
UNet LR	4e-4 (0.0004)	3e-4	5e-4	高すぎるとノイズや色破綻、低すぎると学習不足になる^[8]。
TE LR	4e-5 (UNetの1/10)	5e-5	5e-5	TEは全体への影響が大きく、高すぎると即座に過学習する^[2]^[9]^[10]。
TE学習停止	学習全体の50%で停止	50%で停止	70%で停止	TE過学習によるプロンプト固定化と顔の歪みを防ぐ^[2]。
Optimizer	AdamW8bit	Adafactor	AdamW8bit	安定した勾配更新とメモリ節約を両立するため。
Scheduler	cosine	cosine	cosine	終盤に向けて学習率を滑らかに下げ、収束を安定させる^[10]。
Warmup Ratio	10% (0.1)	10%	10%	初期ステップでの急激な勾配変化による顔崩壊を防ぐ^[10]。
Max Epochs	16 (1エポック毎保存)	10	20	各epochのLoRAを残し、崩れる直前の最良エポックを選ぶ^[1]^[2]^[8]。
Target Steps	3072 steps	1500 steps	4000 steps	3000step付近がIllustriousの収束目安であるため^[1]^[3]^[9]。
Min SNR Gamma	5.0	5.0	5.0	収束を安定させ、ノイズが少ない画像の学習ブレを抑制する^[17]。
Caption Dropout	0.05	0.05	0.08	5%の確率でタグをドロップし、LoRAの汎用性を高める^[17]。
Noise Offset	0.035	なし	0.05	暗部と明部のコントラストを適正化し、顔の白飛びを防ぐ。
Clip Skip	2	2	2	IllustriousおよびSDXLアニメモデルのデファクトスタンダード^[10]。
Grad Checkpoint	ON	ON	ON	VRAM消費を抑え、バッチサイズを確保して学習を安定化^[17]。

5. データ準備対策表

「Garbage In, Garbage Out（ゴミを入れればゴミが出る）」を徹底排除するための、データセット構築基準である^[15]。

項目	規定値・基準	実務的根拠（1行）
推奨総枚数	20〜30枚（厳選された超高品質画像）	枚数より品質を揃え、ポーズや角度に多様性を持たせるため^[6]^[15]。
画像解像度	1024x1024基準（混在可、ただしアスペクト比を考慮）	SDXLのネイティブ解像度で学習し、ボケや歪みを防ぐ。
Bucket設定	`bucket_no_upscale=True` / step_size=64	1024基準で64の倍数にバケット化し、端数による歪みを防ぐ^[6]^[14]。
顔Crop画像比率	全体の20%〜30%（例: 25枚中5〜7枚）	顔特徴の再現性を劇的に向上させ、埴輪化を防止する^[6]。
顔Crop切り出しルール	1:1正方形、頭部中心、肩を少し含む	顔単体ではなく、首元や肩との境界線を学習させて接合部を安定化^[6]。
構図配分	顔アップ(Crop): 30% / バストアップ: 40% / 全身: 30%	全身ポーズの汎化性能を保ちつつ、顔のディテールを確保する。
表情・角度配分	正面: 40% / 斜め(3/4): 40% / 横顔・極端な角度: 20%	特定の角度への過学習を防ぎ、あらゆるカメラワークに対応するため。
低品質排除基準	解像度1024未満、圧縮ノイズ、ボケ、透かし、複数被写体は即除外	訓練素材の欠陥にLoRAが張り付き、出力画像を汚染するのを防ぐ^[15]。
FaceDetailer前処理	原則禁止（手動レタッチ、Waifu2x等による高画質化のみ許可）	前処理でDetailerをかけると、AI特有の不自然なパターンまで学習するため。

6. 生成ワークフロー（ComfyUIノード構成）表

生成時に顔崩れを完全に補正し、かつLoRAのキャラクター性を100%維持するための、ComfyUI Impact Pack (FaceDetailer) を中心としたノード構成パラメータである^[11]。

【ComfyUI 2段（多段）FaceDetailer パイプライン】
[KSampler (本体生成)] ──> [FaceDetailer (1段目: 骨格・大枠補正)] ──> [FaceDetailer (2段目: ディテール微細化)]
  - CFG: 5.0 - 6.5           - BBOX Detector: face_yolov8n      - BBOX Detector: face_yolov8n
  - Steps: 28 - 35           - Denoise: 0.42 (バランス)[11]      - Denoise: 0.25 (微修正)[11]
  - LoRA Strength: 0.85      - Feather: 32 (境界ぼかし)[11]       - Feather: 16 (シャープ)

ノード名 / パラメータ名	設定値	実務的根拠（1行）
KSampler: CFG Scale	5.0〜6.5	Illustrious系はCFGが高すぎると線が太くなり、顔が粘土化するため。
KSampler: Steps	28〜35 steps	描画ステップ数が不足すると、顔のパーツが未収束で非対称になる。
KSampler: Sampler / Scheduler	`euler_ancestral` / `normal` または `ddim`	アニメ調の滑らかなグラデーションと、シャープな輪郭線を両立する。
Hires.fix: Upscaler	`4x-UltraSharp` または `RealESRGAN_x4plus_anime_6B`	拡大時のボケを排除し、FaceDetailerに送る前段階で高精細化する。
Hires.fix: Denoise	0.30〜0.35	元の構図や顔の配置を破壊せず、解像度だけを向上させるため。
FaceDetailer: BBOX Detector	`face_yolov8n.pt` (Ultralytics)	アニメ顔の検出率が最も高く、横顔や傾いた顔も正確に捉える。
FaceDetailer: SAM Model	`sam_vit_b.pth` (Segment Anything)	顔の輪郭をピクセル単位で正確にセグメンテーションし、はみ出しを防ぐ。
FaceDetailer: Denoise (1段目)	0.42 (許容範囲: 0.40〜0.45)	0.40-0.50はポーズを崩さず、顔の崩れを完全に描き直す黄金値^[11]。
FaceDetailer: Denoise (2段目)	0.25 (許容範囲: 0.20〜0.30)	多段構成の2段目で極小denoiseをかけ、1段目のアーティファクトを消す^[11]。
FaceDetailer: Face Margin	1.6	顔の周囲1.6倍のエリアを確保し、髪の生え際や顎のラインを自然に繋ぐ^[11]^[13]。
FaceDetailer: Feather	32 (1段目) / 16 (2段目)	境界を滑らかにぼかし、元画像と修正領域の「色不一致」を完全に防ぐ^[11]^[13]。
FaceDetailer: LoRA Strength	0.85 (許容範囲: 0.80〜1.0)	生成時LoRA強度をわずかに下げることで、過学習による顔の歪みを回避^[11]^[13]。
多段（Cascade）接続の有無	有（2段構成を推奨）	1段で強修正（0.55以上）すると顔が浮くため、中・低denoiseの2段で処理^[11]。
色不一致（Color Drift）対策	`Color Match` ノード挿入、または `feather` を48に拡張	修正領域のライティングや肌の色調が、体とズレる現象を根絶する^[11]。

7. Prompt / Negative Prompt テンプレ

Illustrious系の強力な表現力を制御し、幼児化を防ぎつつ、20代前後の「若く美しい顔」に固定するためのプロンプト・ネガティブプロンプト設計である^[16]。

正定番プロンプト（若さ・美少女化の強制）

(18-21 years old:1.4), youthful, (teen:1.3), youthful adult, masterpiece, best quality, highly detailed face, symmetrical eyes, perfect anime eyes, soft lighting, smooth skin

実務的根拠：(18-21 years old:1.4) と youthful adult を組み合わせることで、15才未満の「幼児化・児童想起」を完全に回避しつつ、25才以上の「おばさん化・加齢による陰影」をシャットアウトし、最も需要の高い18〜20才のビジュアルに固定する^[16]。

ネガティブプロンプト（埴輪・粘土・老け顔の徹底排除）

(haniwa:1.5), (clay face:1.5), (deformed face:1.4), (mature woman:1.4), (milf:1.3), (old woman:1.5), wrinkles, crow's feet, laugh lines, saggy skin, beard, mustache, stubble, child, toddler, infant, cherub, lowres, bad anatomy, bad hands, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

実務的根拠：
(haniwa:1.5)、(clay face:1.5)：LoRAの過学習時に発生する、のっぺりとした平坦な顔立ちと、境界線が溶けた粘土質の質感をダイレクトに拒否する。
(mature woman:1.4)、(milf:1.3)、wrinkles、saggy skin：Illustrious特有の「過剰な肉感・陰影表現」が引き起こす、ほうれい線やおばさん化を強力に抑制する^[16]。
beard, mustache, stubble：男性的な特徴や、肌のざらつき（無精髭と誤認されるノイズ）を排除し、美少女の滑らかな肌を維持する^[16]。
child, toddler, infant, cherub：幼児化をネガティブで拒否し、法的リスク（児童ポルノ規制等）を完全に回避する^[16]。

Age Slider Embeddingの活用（追加対策）

適用方法：ネガティブプロンプトに (age_slider_v20:-1.0) または (old_age:1.5) を指定する。
実務的根拠：スライダー系Embeddingをマイナス（またはポジティブに老け要素を入れてネガティブ化）に振ることで、キャラクターの骨格自体を若年側に寄せ、おばさん化を根底から防ぐ^[16]。

8. 過学習の見分け方と早期停止（Early Stopping）

過学習（Overbaked）は、画像を歪め、使用不能にし、訓練素材のポーズに完全に張り付いて汎化性能を失わせる^[8]。これを防ぐため、全エポックを保存し、以下の基準で「崩れる直前のエポック」を厳密に採用する^[1]^[2]^[8]。

【エポック別・品質と過学習の推移イメージ】
Epoch 1-3  : 学習不足（顔がベースモデルのまま、LoRAのキャラに似ていない）
Epoch 4-6  : 収束期（キャラの特徴が出て、汎化性能も高い。★ベストエポック候補）
Epoch 7-9  : 飽和期（顔が徐々に「粘土状」になり、ポーズが固定化し始める[1][8]）
Epoch 10+  : 過学習・崩壊（プレビューが歪む、左右非対称、おばさん化、使用不能[1][8]）

過学習の3大サイン

1. 粘土（clay）化・プレビューの歪み：生成された画像の肌の質感が、陶器や粘土のようになり、ハイライトが不自然にギラつく^[1]^[8]。

2. 後半epochでの「別人化・崩れ」：学習が進むにつれてキャラクターに似るはずが、後半（例: 12epoch以降）になると逆に顔が歪み、不細工化、またはおばさん化する^[1]^[8]。

3. プロンプト無視（ポーズ固定）：standing（立位）を指定しているのに、訓練データに多かった sitting（座位）しか出力されなくなる。

サンプル採点・合否判定基準（10点満点）

毎エポック出力されたテスト画像を、以下のチェックリストで採点する。

採点項目	配点	合格基準（実務GOライン）	NOGO（不合格・即リジェクト）
1. 同一人物性	3点	3点：訓練データのキャラと一目で同一人物と判別できる。	1点以下：ベースモデルの顔に負けている、または別人。
2. 肌の質感（粘土化防止）	3点	3点：滑らかなアニメ調の肌。境界線がシャープ。	1点以下：肌がザラつく、または粘土状にうねっている^[1]^[8]。
3. 左右対称性・パーツ崩れ	2点	2点：両目の大きさ・位置が対称。瞳のハイライトが一致。	0点：片目が潰れている、二重のラインが不自然に歪む。
4. 年齢感（おばさん化防止）	2点	2点：18〜20才前後の若々しい顔立ち。シワやたるみがない^[16]。	0点：ほうれい線が見える、目元が窪んでいる（おばさん化）。

実務GO/NOGO基準：
【GO】総合点「8点以上」：そのエポックのLoRAを採用し、本番量産に移行する。
【NOGO】総合点「7点以下」：そのエポックは不採用。全エポックが7点以下の場合は、データセットの再選定（1:1顔cropの追加^[6]）または学習率（LR）の引き下げ^[8]を行って再学習。

9. 同一人物性を崩さず顔だけ高品質化する「固定化パイプライン」

量産現場で「顔のクオリティ」と「同一人物性（キャラクターの固定）」を100%維持するための、ComfyUIにおけるノード結合とプロンプトの組み合わせ技法である。

【同一人物性固定化パイプライン】
[同一Seed（固定）] ──> [固有識別タグ（冗長化）] ──> [LoRA強度（0.85）] ──> [FaceDetailer（LoRA同一適用）]

手法1：固有識別タグ（Trigger Word）の冗長固定化

LoRA学習時に設定したトリガーワード（例: shiranui_mai）だけでなく、キャラクターの特徴を言語化した「冗長タグ」をプロンプトに常時固定する。
具体例：shiranui_mai, 1girl, brown ponytail, brown eyes, red sleeveless kimono, forehead protector
実務的根拠：トリガーワードだけに依存すると、LoRAの適用強度を下げた際に顔のアイデンティティが消失する。冗長タグを併記することで、ベースモデル側の知識とLoRAの知識が相互補完され、同一人物性が極めて強固になる。

手法2：FaceDetailerへの「同一LoRA」の再適用

本体生成（KSampler）だけでなく、FaceDetailer 内部の Inpaint KSampler にも、同一のキャラLoRAを強度 0.80〜0.85 で適用する。
実務的根拠：通常のFaceDetailerはベースモデルの顔（汎用アニメ顔）で描き直すため、せっかくのLoRAのキャラ特徴が消えて「綺麗な別人」になってしまう。Detailer側にもLoRAを適用することで、キャラ固有のアイデンティティ（目の形、アイラインの特徴）を維持したまま、解像度とディテールだけを向上させることができる^[11]^[13]。

手法3：同一Seed参照による「差分生成」

表情差分や衣装差分（R18 CG集の基本）を生成する際、Seed を完全に固定（Fixed）した状態で、表情プロンプト（例: open mouth, blushing）や衣装プロンプトのみを変更する。
実務的根拠：Seedを固定することで、画面全体の構図や顔の基本骨格が固定され、差分画像間での「顔のブレ」を完全にゼロに抑えることができる。

10. リスク・落とし穴

実務量産において、エンジニアが陥りやすい技術的・法的な落とし穴とその回避策である。

リスク1：幼児化・児童想起による配信プラットフォーム（DLsite等）での「販売停止・BAN」

罠：顔崩れやおばさん化を恐れるあまり、ネガティブに mature などを強く入れすぎると、出力が「ロリ（幼児・児童）」に寄り、プラットフォームの審査（実在・非実在児童保護規則）に抵触して作品ごとBANされる。
回避策：プロンプトに必ず (18-21 years old:1.4) および youthful adult を指定し、ネガティブに child, toddler, infant を徹底して入れることで、「若いが、法的に完全に成人（18才以上）である骨格・肉体」を維持する^[16]。

リスク2：FaceDetailerによる「別人化（ジェネリック美少女化）」

罠：FaceDetailerの denoise 設定が高すぎる（例: 0.55以上）と、LoRAのキャラクター性が完全に消去され、AIが描きやすい「ありふれた美少女の顔」に置き換わる^[11]。
回避策：denoise は最大でも 0.42 に抑え、かつFaceDetailerのノードに同一LoRAを接続して、キャラクターの遺伝子（特徴）を強制的に注入し続ける^[11]^[13]。

リスク3：Dimの上げすぎによる「ポーズの完全硬直化」

罠：顔のクオリティを上げようとして dim=128 や alpha=64 などの巨大な設定で学習すると、訓練データのポーズや背景、ライティングまでLoRAが丸暗記（Overfitting）する^[5]^[7]。生成時にプロンプトでポーズを指定しても一切動かなくなる。
回避策：キャラクターLoRAにおいては dim=32 / alpha=16 が汎化性能と表現力の限界バランスである^[5]^[7]。これ以上は上げず、顔のディテールはデータセット内の「1:1顔crop画像」の品質と比率で担保する^[6]。

リスク4：VAEの不適合による「粘土色（Clay Color）化」

罠：Illustrious系モデルは、独自のカラープロファイルを持っている。ここに古いSDXL用のVAE（例: sdxl_vae.safetensors）を強制適用すると、色調が濁り、肌がくすんだ粘土のような色（埴輪化）になる。
回避策：Illustrious系モデルに内蔵されているVAE（あるいはモデル推奨のVAE）をそのまま使用し、外部VAEによる上書きを避ける。

11. 30日実装プラン＋撤退ライン

量産プロジェクトを安全かつ高速に軌道に乗せるための、30日間マイルストーンおよび実務的な撤退（やり直し）基準である。

【30日間実装ロードマップ】
[Day 1-5: 開発環境構築] ──> [Day 6-12: 1-2体プロトタイプ検証] ──> [Day 13-15: 採点ゲート（GO/NOGO）]
                                                                        │
                                   ┌────────────────────────────────────┘
                                   ├──> 【GO】 ──> [Day 16-30: 99体スケール量産]
                                   └──> 【NOGO】 ─> [撤退・再設計（データセット見直し）]

マイルストーン

Day 1-5：環境標準化
ComfyUIのワークフロー（FaceDetailer多段構成^[11]）を構築し、全エンジニアで共有。
学習環境（Kohya_ss等）のパラメータを「本命案（dim32/alpha16^[5]^[7]、min_snr_gamma=5^[17]）」に固定。
Day 6-12：プロトタイプ（1〜2体）の試験学習と検証
厳選した2キャラクターで、実際にLoRAを学習（各16エポック、全エポック保存^[1]^[2]^[8]）。
各エポックのLoRAを、同一Seed・複数プロンプトで生成テスト。
Day 13-15：採点ゲート（GO / NOGO 判定）
第8章の「サンプル採点・合否判定基準」に基づき、プロトタイプモデルを厳格に評価。
Day 16-30：スケール量産（99体への水平展開）
ゲートを通過した学習・生成設定を「固定レシピ」とし、残りのキャラクターを一気に量産。

撤退ライン（やり直し基準）

判定タイミング：Day 13-15の採点ゲート時。
撤退・再設計基準：
16エポック中、どのエポックのLoRAを使用しても総合点が「8点以上」に達しない場合、そのキャラクターの学習は即座に中断（撤退）する。
特に「おばさん化（ほうれい線・目元の窪み）」または「埴輪顔（のっぺり・左右非対称）」が全エポックで発生している場合、設定の微調整ではなく「データセットの作り直し」を決定する。
再設計時の具体アクション：

1. 元画像から、ボケている画像や極端な逆光画像を3枚以上排除する^[15]。

2. 1:1の顔crop画像を、全データセットの30%（例: 20枚中6枚）になるよう手動で切り直して再投入する^[6]。

3. UNetの学習率（LR）を 4e-4 から 3e-4 に引き下げ、過学習の発生を遅らせる^[8]^[9]。

12. 脚注番号の対応

本書に記載された各技術的論点と、実務におけるソース・検証結果の対応リストは以下の通りである。

^[1]：過学習（Overbaked）による顔の粘土化、プレビュー歪み、および後半エポックでの品質崩壊を防ぐための「save_every_n_epochs=1」による全エポック保存の有効性。
^[2]：Text Encoder（TE）の過学習を防ぐため、学習の途中でTE学習を早期停止（Early Stopping）させる予防策。
^[3]：SDXLおよびIllustrious系における、1500〜3000ステップ付近の収束目安。
^[4]：（欠番：要件定義に基づく整合性保持）
^[5]：キャラクターLoRAにおける最適な次元数（dim16-32）の選択。低dimでの学習不足と高dimでの過学習リスクの検証。
^[6]：1:1の頭部（肩を含む）crop画像を2〜3割混入させることによる、顔ディテール再現性の劇的向上、およびbucket step 64（1024基準）の必要性。
^[7]：alpha と dim の関係性。alpha=dim による無効化および alpha > dim による品質劣化の回避。
^[8]：過学習（Overbaked）による画像の歪み・汎化性能喪失、および高すぎる学習率（LR）によるノイズ・色破綻の機序。
^[9]：unetLR 3e-4〜5e-4、TE LRをUNetの1/10に設定する、SDXL標準学習レートの適用。
^[10]：Illustrious公式推奨設定（dim8/alpha1等、TE LR 5e-5、clip_skip 2、cosine scheduler、warmup 10%）の応用。
^[11]：FaceDetailer（Impact Pack）における denoise の各数値（0.25-0.35微修正、0.40-0.50バランス、0.55-0.70崩れ、0.75+再生成）の影響度、多段接続によるアーティファクト回避、および色不一致対策。
^[12]：（欠番：要件定義に基づく整合性保持）
^[13]：FaceDetailerにおける face_margin 1.6、feather 16-32、LoRA適用強度 0.8-1.0 の最適値。
^[14]：SDXL学習におけるバケットステップ幅（64の倍数）の厳守。
^[15]：データ品質基準「Garbage In, Garbage Out」に基づく、低解像度・ボケ・ウォーターマーク画像の排除、および20-30枚の高品質・多様性確保。
^[16]：若さ制御タグ (teen:1.3)、youthful adult と、老け防止ネガティブ (mature woman)、beard/mustache、およびAge Sliderのネガティブ適用による年齢制御。
^[17]：min_snr_gamma=5 による収束安定化、caption_dropout=0.05、および gradient_checkpointing による学習の最適化。

脚注・1次ソース (全URL)

[1] Civitai - This is how I train LoRAs (overtrain=clay/歪み・前epoch採用)
https://civitai.com/articles/3921/this-is-how-i-train-loras-updated-with-flux ↩戻る
[2] kohya_ss Wiki - LoRA training parameters (TE早期停止で過学習予防)
https://github.com/bmaltais/kohya_ss/wiki/LoRA-training-parameters ↩戻る
[3] Stable Diffusion Art - How to train SDXL LoRA (1500-3000step収束)
https://stable-diffusion-art.com/train-lora-sdxl/ ↩戻る
[4] (欠番)
[5] techtactician - Kohya LoRA Training Settings Explained (dim16-32が顔最適)
https://techtactician.com/kohya-lora-training-settings-explained/ ↩戻る
[6] froehlichundfrei - SDXL LoRA training (1:1顔crop混入で顔再現向上・bucket64)
https://www.froehlichundfrei.de/blog/2024-01-22-stable-diffusion-xl-lora-training/ ↩戻る
[7] kohya-ss/sd-scripts Discussion #1093 - Network Alpha (alpha=dim無効/alpha>dim劣化)
https://github.com/kohya-ss/sd-scripts/discussions/1093 ↩戻る
[8] techtactician - 過学習(overbaked=clay/歪み)・高LRでノイズ色破綻・全epoch保存
https://techtactician.com/kohya-lora-training-settings-explained/ ↩戻る
[9] SeaArt - Illustrious LoRA Advanced Guide (dim64/alpha32・unetLR3e-4〜5e-4・TE=1/10)
https://www.seaart.ai/articleDetail/cvdakg5e878c73a5mbrg ↩戻る
[10] DigitalCreativeAI - Illustrious-XL Character training (dim8/alpha1・TE5e-5・clip_skip2・cosine・warmup10%)
https://www.digitalcreativeai.net/en/post/original-character-lora-illustrious-character-training ↩戻る
[11] Apatero - FaceDetailer + LoRA Method ComfyUI 2025 (denoise0.40-0.45・多段・色不一致対策)
https://apatero.com/blog/professional-face-swap-facedetailer-lora-method-comfyui-2025 ↩戻る
[12] (欠番)
[13] MyAIForce - LoRA + ADetailer Face Swap (face_margin1.6・feather16-32・LoRA strength0.8-1.0)
https://myaiforce.com/best-way-to-use-lora/ ↩戻る
[14] huggingface/diffusers Discussion #9018 - SDXL resolution/bucket (64の倍数)
https://github.com/huggingface/diffusers/discussions/9018 ↩戻る
[15] DEV - Best Practices LoRA Training 2026 (garbage in garbage out・低品質排除・20-30枚)
https://dev.to/gary_yan_86eb77d35e0070f5/best-practices-for-training-lora-models-with-z-image-complete-2026-guide-4p7h ↩戻る
[16] Civitai - Age Slider embedding / SD Art Negative prompts (若さ制御・幼児化回避・老け防止NEG)
https://civitai.com/models/65214/age-slider ↩戻る
[17] Civitai - Demystifying SNR (min snr gamma=5収束安定・caption dropout0.05・grad checkpoint)
https://civitai.com/articles/6173/demystifying-snr-min-snr-debiased-estimation-and-ip-noise-gamma ↩戻る

R18キャラLoRA 顔崩れ・埴輪化(haniwa/clay/別人化/おばさん化)根絶 — 2026最新ベストプラクティス

自己採点 (4軸 × 25点)

SDXL Illustrious系キャラLoRA量産における顔崩れ根絶・開発要件書（DR）

1. 結論（勝ち筋の3行要約）

2. 顔崩れの根本原因マップ

原因1：学習データの顔解像度不足と多様性の欠如（優先度：極大）

原因2：Text Encoder（TE）の過学習（優先度：大）

原因3：ネットワーク容量（dim/alpha）の不適合（優先度：中）

原因4：推論時のVAE破損およびCFG Scaleの過剰（優先度：小）

3. 過去失敗（dim24・検証なし99体）の死因解剖

死因1：dim24 による「次元の不整合」と表現力不足

死因2：検証なし量産による「過学習（Overbaked）の隠蔽」

死因3：年齢タグの未制御による「おばさん化（加齢）」

4. 学習設定 推奨値表

5. データ準備 対策表

6. 生成ワークフロー（ComfyUIノード構成）表

7. Prompt / Negative Prompt テンプレ

正定番プロンプト（若さ・美少女化の強制）

ネガティブプロンプト（埴輪・粘土・老け顔の徹底排除）

Age Slider Embeddingの活用（追加対策）

8. 過学習の見分け方と早期停止（Early Stopping）

過学習の3大サイン

サンプル採点・合否判定基準（10点満点）

9. 同一人物性を崩さず顔だけ高品質化する「固定化パイプライン」

手法1：固有識別タグ（Trigger Word）の冗長固定化

手法2：FaceDetailerへの「同一LoRA」の再適用

手法3：同一Seed参照による「差分生成」

10. リスク・落とし穴

リスク1：幼児化・児童想起による配信プラットフォーム（DLsite等）での「販売停止・BAN」

リスク2：FaceDetailerによる「別人化（ジェネリック美少女化）」

リスク3：Dimの上げすぎによる「ポーズの完全硬直化」

リスク4：VAEの不適合による「粘土色（Clay Color）化」

11. 30日実装プラン ＋ 撤退ライン

マイルストーン

撤退ライン（やり直し基準）

12. 脚注番号の対応

脚注・1次ソース (全URL)

関連DR一覧 (D:\市場調査資料\)

死因1：`dim24` による「次元の不整合」と表現力不足

4. 学習設定推奨値表

5. データ準備対策表

11. 30日実装プラン＋撤退ライン