AIエロ漫画_キャラLoRA一貫性を完璧にする最新手法2026
cc3 / dr_gemini / 2026-06-02
AIエロ漫画制作において「全ページでキャラの顔・髪・体型・衣装を完璧に一貫させる」という要求は、単一のLoRAやプロンプトだけで達成することは2026年現在でも不可能です。
結論から言います。**「LoRAで大枠のパーツ(髪型・体型・衣装)を固定し、PuLIDで顔の造形を固定し、生成後のFace Detailer(局所インペイント)でキャラLoRAを再度叩き込む」という多重防護パイプライン(ComfyUI推奨)以外に、プロレベルの一貫性を担保する手法はありません。**
RTX 3090(VRAM 24GB)という強力な環境を前提に、Illustrious-XL / Pony系モデルで商業クオリティに耐えうる極限の設定値を提示します。
---
### ① キャラLoRA学習(kohya_ss / sd-scripts)
Illustrious/Pony系は、SD1.5や無印SDXLに比べて「タグの理解力」が異常に高い一方、エロ描写(ポーズや絡み)の自由度を奪わないように学習させる必要があります。
#### 推奨設定値(RTX 3090 / 24GB VRAM)
| 項目 | 設定値 | 理由・解説 |
| :--- | :--- | :--- |
| **データセット枚数** | **30〜50枚**(厳選) | 多すぎると自由度が死に、少なすぎると衣装や髪型が固定できません。 |
| **画像のバリエーション** | **顔アップ10、全身15、エロ(全裸/下着)15、特殊アングル10** | **最重要**:全裸画像を必ず1/3以上混ぜること。そうしないと「衣装=キャラの皮膚」と学習され、服を脱がせられなくなります。 |
| **解像度** | **1024 x 1024** | Illustrious/Ponyのネイティブ解像度。これ以下(512など)は学習の質を著しく落とします。 |
| **正則化画像** | **「無し」を推奨** | Pony系はタグ制御(`score_9, score_8_up...`等)が強力なため、正則化画像は不要。入れると表現力が死にます。 |
| **Network Dim / Alpha** | **Dim: 16 / Alpha: 8** | Dim 32以上はノイズを吸いすぎて「表情の硬直化」や「ポーズの固定化」を招く。16で十分。 |
| **Optimizer** | **Prodigy** | 2026年現在も最適解。学習率(LR)の自動調整が極めて優秀。 |
| **Learning Rate (LR)** | **1.0**(Prodigy使用時) | Prodigyの仕様上、LRは1.0に固定し、`optimizer_args`で制御。 |
| **Optimizer Args** | `decouple=True` `weight_decay=0.01` `d_coef=2.0` `use_bias_correction=True` | Prodigyの学習速度と安定性を最大化する設定。 |
| **Steps** | **総ステップ数:1,500〜2,000** | Repeats: 10(画像50枚の場合、3Epochで1500ステップ)。これ以上は過学習。 |
| **Mixed Precision / Save** | **bf16** | RTX 3090はbf16をネイティブサポートしており、精度と速度が最大化します。 |
#### キャプション(メタデータ)の絶対法則
WD14 Tagger等で自動抽出後、必ず手動で以下のルールに書き換えてください。
* **トリガーワード(例:`mychar`)を設定する。**
* 髪型、髪色、目の色、体型(`flat chest, large breasts`など)は**すべてキャプションから削除(あるいはトリガーワードに内包)**し、衣装(`school uniform, pleated skirt`など)や状態(`nude`)は**キャプションに残す**。
* これにより、「`mychar`を入力するだけで髪型と顔と体型が出現し、衣装タグを追加・変更することで着せ替えが自由になる」LoRAが完成します。
---
### ② IP-Adapter (Illustrious/Ponyにおける最適値)
二次元キャラクター、特にIllustrious系において、実写用のInsightFaceを使用する「IP-Adapter-FaceID」は**厳禁**です。顔がリアル(泥人形化)に引っ張られ、絵柄が完全に崩壊します。
#### 推奨設定(SDXL / Illustrious用)
* **使用モデル**: `ip-adapter-plus_sdxl_vit-h.bin`(または二次元特化の `ip-adapter_sdxl_vit-h.bin`)
* **Weight**: **0.30 〜 0.45** (0.5を超えると、ポーズがリファレンス画像に引っ張られ、エロポーズの生成が不可能になります)
* **Start Step**: **0.0**
* **Ending Step**: **0.65** (生成の後半35%はモデル自体の描写力に任せることで、二次元の綺麗な質感とエロ描写の整合性を保ちます)
---
### ③ LoRAマージ / 階層別マージ (Block Weight)
「キャラLoRA」と「衣装LoRA」や「ポーズLoRA」をそのまま複数重ねると、プロンプトが競合して絵が破綻します。顔・髪の情報を司る「OUT(出力層)」と、体型・ポーズを司る「IN/MID(入力/中間層)」を分離してマージします。
SDXL/Illustrious(12ブロック構造)における、**キャラの「顔・髪」のみを固定し、体型・衣装の自由度を残す**ためのマージレシピ(SD-Webui-SuperMerger または ComfyUI `LoRA Block Weight` ノード):
#### 階層マージレシピ(キャラ顔固定用)
* **階層Weight設定(12ブロック)**:
`[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.1, 0.1, 0.8, 1.0, 1.0, 1.0]`
* **IN(0-5)**: `0.0` (ポーズや構図への干渉を完全に排除)
* **MID(6)**: `0.1` (体型への緩やかな干渉)
* **OUT(7-11)**: `0.8〜1.0` (顔、髪型、目元などのビジュアル要素を100%固定)
この比率でマージした「顔専用LoRA」をベースモデルに**ウェイト0.4〜0.5**で焼き込む(マージする)ことで、生成時のLoRAスロットを節約し、VRAMの節約と生成速度の向上を図ります。
---
### ④ InstantID / PuLID の商用可否と精度
漫画の商業出版(FANZA、DLsite等での販売)を想定した場合、ライセンス問題は避けて通れません。
| 項目 | InstantID | PuLID |
| :--- | :--- | :--- |
| **商用利用可否** | **不可(グレー/ブラック)**<br>※内部で使用している「InsightFace」のライセンスが非商用(CC BY-NC 4.0)のため。 | **可能(ホワイト)**<br>※InsightFaceを使用せず、商用利用可能な「EVA-CLIP」や独自のID抽出アルゴリズムを使用しているため。 |
| **二次元(Pony系)の精度** | **中(実写寄りになる)**<br>顔のパーツ位置は正確だが、絵柄が劇画調やリアル系に引っ張られやすい。 | **極めて高**<br>元絵の「絵柄(アニメ調)」を維持したまま、顔のアイデンティティを固定できる。 |
| **RTX 3090での負荷** | 高(VRAM消費大) | 中(軽量かつ高速) |
**結論:商用エロ漫画では「PuLID」一択です。**
* **PuLID設定値**: `Method: ortho`, `Weight: 0.35〜0.50`。これ以上上げると表情が完全に固定され、エロ漫画に必要な「喘ぎ顔」「嫌悪顔」などの表情差分が作れなくなります。
---
### ⑤ ControlNet (Anytest / Reference)
漫画のコマ割りとポーズの制御、および複数人の絡み(挿入シーン等)におけるControlNetの選定。
* **Reference-only / IP-Adapterの併用**:
SDXL環境において、Reference-onlyは非推奨(挙動が不安定)。代わりに**「Anytest(ControlNet-XS)」**または**「ControlNet Depth」**を使用します。
* **ポーズ・絡みの固定**:
1. **DWPose (Openpose)**: 骨格の固定。
2. **Depth (Zoe / MiDaS)**: 体の重なり(絡み)の前後関係を固定。
* **衣装・背景の一貫性(Anytest)**:
衣装デザインを完全に固定したい場合、前コマの衣装画像を `ControlNet Anytest (tile/recolor)` に入力し、**Weight: 0.3, Ending Step: 0.4** で適用。これにより、細部のデザイン(ボタンの位置、リボンの形など)が自動的に引き継がれます。
---
### ⑥ 複数手法の併用レシピと崩れ対策(RTX 3090 / ComfyUI)
RTX 3090(24GB)を限界まで使い倒し、1ピクセルも妥協しない「エロ漫画専用・一貫性完全担保ワークフロー」の最終構成です。WebUI(A1111)ではVRAM管理とパイプライン制御が甘いため、**ComfyUIでの構築を強く推奨**します。
#### 【完全防護】生成パイプライン(ComfyUI)
```text
[ベースモデル: Illustrious系]
│
├─► [キャラLoRA (階層マージ版)] ──► Weight: 0.45 (顔・髪固定)
│
├─► [PuLID] ──────────────────────► Weight: 0.35 (顔の骨格・アイデンティティ固定)
│
├─► [ControlNet DWPose + Depth] ──► 絡み・ポーズの固定
│
▼
[1次生成 (解像度: 896 x 1152 など、100万画素前後)]
│
▼
[Ultimate SD Upscale (1.5倍)] ──────► Denoise: 0.35 (画質・書き込み量の向上)
│
▼
[Face Detailer (顔専用インペイント)] ─► ★ここで「キャラLoRA (通常版)」を再度適用
(Weight: 0.4、Denoise: 0.25)
```
#### 致命的な「崩れ・バグ」への対策
1. **2人以上の絡みシーンで「顔が混ざる(マージバグ)」**
* **対策**: プロンプトに `1girl, 1boy` と書いても、高確率で男の顔が女に、女の顔が男になります。ComfyUIの **`Regional Sampler (Area Composition)`** を使用し、画面の「左半分=男のLoRA+プロンプト」「右半分=女のLoRA+プロンプト」とマスクで完全に物理分離して生成してください。
2. **表情が死ぬ(無表情・お面化)**
* **対策**: PuLIDやIP-AdapterのWeightが強すぎます。
* PuLID: `0.35` まで下げる。
* プロンプトの表情指定(`screaming, blushing, ecstasy, eyes closed` 等)の重みを `(ecstasy:1.3)` のように強調する。
3. **VRAM不足(OOM)の回避(RTX 3090用)**
* RTX 3090は24GBありますが、SDXL + ControlNet複数 + PuLID + Upscale を同時に走らせると限界に達します。
* ComfyUIの起動引数に `--highvram` を指定。
* Upscale時は `Tile size: 512` で分割処理を行い、一括処理を避けてください。
この「キャラLoRA(階層)+PuLID(弱)+Face Detailer(LoRA再適用)」の3層構造を徹底することで、2026年現在、商業誌と遜色ない「全ページ同一人物」のエロ漫画を高効率で量産することが可能です。