AIエロ漫画_キャラLoRA一貫性を完璧にする最新手法2026

cc3 / dr_gemini / 2026-06-02

AIエロ漫画制作において「全ページでキャラの顔・髪・体型・衣装を完璧に一貫させる」という要求は、単一のLoRAやプロンプトだけで達成することは2026年現在でも不可能です。

結論から言います。**「LoRAで大枠のパーツ（髪型・体型・衣装）を固定し、PuLIDで顔の造形を固定し、生成後のFace Detailer（局所インペイント）でキャラLoRAを再度叩き込む」という多重防護パイプライン（ComfyUI推奨）以外に、プロレベルの一貫性を担保する手法はありません。**

RTX 3090（VRAM 24GB）という強力な環境を前提に、Illustrious-XL / Pony系モデルで商業クオリティに耐えうる極限の設定値を提示します。

---

### ① キャラLoRA学習（kohya_ss / sd-scripts）

Illustrious/Pony系は、SD1.5や無印SDXLに比べて「タグの理解力」が異常に高い一方、エロ描写（ポーズや絡み）の自由度を奪わないように学習させる必要があります。

#### 推奨設定値（RTX 3090 / 24GB VRAM）

| 項目 | 設定値 | 理由・解説 |
| :--- | :--- | :--- |
| **データセット枚数** | **30〜50枚**（厳選） | 多すぎると自由度が死に、少なすぎると衣装や髪型が固定できません。 |
| **画像のバリエーション** | **顔アップ10、全身15、エロ（全裸/下着）15、特殊アングル10** | **最重要**：全裸画像を必ず1/3以上混ぜること。そうしないと「衣装＝キャラの皮膚」と学習され、服を脱がせられなくなります。 |
| **解像度** | **1024 x 1024** | Illustrious/Ponyのネイティブ解像度。これ以下（512など）は学習の質を著しく落とします。 |
| **正則化画像** | **「無し」を推奨** | Pony系はタグ制御（`score_9, score_8_up...`等）が強力なため、正則化画像は不要。入れると表現力が死にます。 |
| **Network Dim / Alpha** | **Dim: 16 / Alpha: 8** | Dim 32以上はノイズを吸いすぎて「表情の硬直化」や「ポーズの固定化」を招く。16で十分。 |
| **Optimizer** | **Prodigy** | 2026年現在も最適解。学習率（LR）の自動調整が極めて優秀。 |
| **Learning Rate (LR)** | **1.0**（Prodigy使用時） | Prodigyの仕様上、LRは1.0に固定し、`optimizer_args`で制御。 |
| **Optimizer Args** | `decouple=True` `weight_decay=0.01` `d_coef=2.0` `use_bias_correction=True` | Prodigyの学習速度と安定性を最大化する設定。 |
| **Steps** | **総ステップ数：1,500〜2,000** | Repeats: 10（画像50枚の場合、3Epochで1500ステップ）。これ以上は過学習。 |
| **Mixed Precision / Save** | **bf16** | RTX 3090はbf16をネイティブサポートしており、精度と速度が最大化します。 |

#### キャプション（メタデータ）の絶対法則
WD14 Tagger等で自動抽出後、必ず手動で以下のルールに書き換えてください。
* **トリガーワード（例：`mychar`）を設定する。**
* 髪型、髪色、目の色、体型（`flat chest, large breasts`など）は**すべてキャプションから削除（あるいはトリガーワードに内包）**し、衣装（`school uniform, pleated skirt`など）や状態（`nude`）は**キャプションに残す**。
* これにより、「`mychar`を入力するだけで髪型と顔と体型が出現し、衣装タグを追加・変更することで着せ替えが自由になる」LoRAが完成します。

---

### ② IP-Adapter (Illustrious/Ponyにおける最適値)

二次元キャラクター、特にIllustrious系において、実写用のInsightFaceを使用する「IP-Adapter-FaceID」は**厳禁**です。顔がリアル（泥人形化）に引っ張られ、絵柄が完全に崩壊します。

#### 推奨設定（SDXL / Illustrious用）
* **使用モデル**: `ip-adapter-plus_sdxl_vit-h.bin`（または二次元特化の `ip-adapter_sdxl_vit-h.bin`）
* **Weight**: **0.30 〜 0.45** （0.5を超えると、ポーズがリファレンス画像に引っ張られ、エロポーズの生成が不可能になります）
* **Start Step**: **0.0**
* **Ending Step**: **0.65** （生成の後半35%はモデル自体の描写力に任せることで、二次元の綺麗な質感とエロ描写の整合性を保ちます）

---

### ③ LoRAマージ / 階層別マージ (Block Weight)

「キャラLoRA」と「衣装LoRA」や「ポーズLoRA」をそのまま複数重ねると、プロンプトが競合して絵が破綻します。顔・髪の情報を司る「OUT（出力層）」と、体型・ポーズを司る「IN/MID（入力/中間層）」を分離してマージします。

SDXL/Illustrious（12ブロック構造）における、**キャラの「顔・髪」のみを固定し、体型・衣装の自由度を残す**ためのマージレシピ（SD-Webui-SuperMerger または ComfyUI `LoRA Block Weight` ノード）：

#### 階層マージレシピ（キャラ顔固定用）
* **階層Weight設定（12ブロック）**:
`[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.1, 0.1, 0.8, 1.0, 1.0, 1.0]`
* **IN（0-5）**: `0.0` （ポーズや構図への干渉を完全に排除）
* **MID（6）**: `0.1` （体型への緩やかな干渉）
* **OUT（7-11）**: `0.8〜1.0` （顔、髪型、目元などのビジュアル要素を100%固定）

この比率でマージした「顔専用LoRA」をベースモデルに**ウェイト0.4〜0.5**で焼き込む（マージする）ことで、生成時のLoRAスロットを節約し、VRAMの節約と生成速度の向上を図ります。

---

### ④ InstantID / PuLID の商用可否と精度

漫画の商業出版（FANZA、DLsite等での販売）を想定した場合、ライセンス問題は避けて通れません。

| 項目 | InstantID | PuLID |
| :--- | :--- | :--- |
| **商用利用可否** | **不可（グレー/ブラック）**<br>※内部で使用している「InsightFace」のライセンスが非商用（CC BY-NC 4.0）のため。 | **可能（ホワイト）**<br>※InsightFaceを使用せず、商用利用可能な「EVA-CLIP」や独自のID抽出アルゴリズムを使用しているため。 |
| **二次元（Pony系）の精度** | **中（実写寄りになる）**<br>顔のパーツ位置は正確だが、絵柄が劇画調やリアル系に引っ張られやすい。 | **極めて高**<br>元絵の「絵柄（アニメ調）」を維持したまま、顔のアイデンティティを固定できる。 |
| **RTX 3090での負荷** | 高（VRAM消費大） | 中（軽量かつ高速） |

**結論：商用エロ漫画では「PuLID」一択です。**
* **PuLID設定値**: `Method: ortho`, `Weight: 0.35〜0.50`。これ以上上げると表情が完全に固定され、エロ漫画に必要な「喘ぎ顔」「嫌悪顔」などの表情差分が作れなくなります。

---

### ⑤ ControlNet (Anytest / Reference)

漫画のコマ割りとポーズの制御、および複数人の絡み（挿入シーン等）におけるControlNetの選定。

* **Reference-only / IP-Adapterの併用**:
SDXL環境において、Reference-onlyは非推奨（挙動が不安定）。代わりに**「Anytest（ControlNet-XS）」**または**「ControlNet Depth」**を使用します。
* **ポーズ・絡みの固定**:
1. **DWPose (Openpose)**: 骨格の固定。
2. **Depth (Zoe / MiDaS)**: 体の重なり（絡み）の前後関係を固定。
* **衣装・背景の一貫性（Anytest）**:
衣装デザインを完全に固定したい場合、前コマの衣装画像を `ControlNet Anytest (tile/recolor)` に入力し、**Weight: 0.3, Ending Step: 0.4** で適用。これにより、細部のデザイン（ボタンの位置、リボンの形など）が自動的に引き継がれます。

---

### ⑥ 複数手法の併用レシピと崩れ対策（RTX 3090 / ComfyUI）

RTX 3090（24GB）を限界まで使い倒し、1ピクセルも妥協しない「エロ漫画専用・一貫性完全担保ワークフロー」の最終構成です。WebUI（A1111）ではVRAM管理とパイプライン制御が甘いため、**ComfyUIでの構築を強く推奨**します。

#### 【完全防護】生成パイプライン（ComfyUI）

```text
[ベースモデル: Illustrious系]
│
├─► [キャラLoRA (階層マージ版)] ──► Weight: 0.45 (顔・髪固定)
│
├─► [PuLID] ──────────────────────► Weight: 0.35 (顔の骨格・アイデンティティ固定)
│
├─► [ControlNet DWPose + Depth] ──► 絡み・ポーズの固定
│
▼
[1次生成 (解像度: 896 x 1152 など、100万画素前後)]
│
▼
[Ultimate SD Upscale (1.5倍)] ──────► Denoise: 0.35 (画質・書き込み量の向上)
│
▼
[Face Detailer (顔専用インペイント)] ─► ★ここで「キャラLoRA (通常版)」を再度適用
(Weight: 0.4、Denoise: 0.25)
```

#### 致命的な「崩れ・バグ」への対策

1. **2人以上の絡みシーンで「顔が混ざる（マージバグ）」**
* **対策**: プロンプトに `1girl, 1boy` と書いても、高確率で男の顔が女に、女の顔が男になります。ComfyUIの **`Regional Sampler (Area Composition)`** を使用し、画面の「左半分＝男のLoRA＋プロンプト」「右半分＝女のLoRA＋プロンプト」とマスクで完全に物理分離して生成してください。
2. **表情が死ぬ（無表情・お面化）**
* **対策**: PuLIDやIP-AdapterのWeightが強すぎます。
* PuLID: `0.35` まで下げる。
* プロンプトの表情指定（`screaming, blushing, ecstasy, eyes closed` 等）の重みを `(ecstasy:1.3)` のように強調する。
3. **VRAM不足（OOM）の回避（RTX 3090用）**
* RTX 3090は24GBありますが、SDXL + ControlNet複数 + PuLID + Upscale を同時に走らせると限界に達します。
* ComfyUIの起動引数に `--highvram` を指定。
* Upscale時は `Tile size: 512` で分割処理を行い、一括処理を避けてください。

この「キャラLoRA（階層）＋PuLID（弱）＋Face Detailer（LoRA再適用）」の3層構造を徹底することで、2026年現在、商業誌と遜色ない「全ページ同一人物」のエロ漫画を高効率で量産することが可能です。