キャラ一貫性LoRA作成_完全手順/キャラLoRA一貫性最大化_学習データ設計/LoRA量産高速化×一貫性/三面図キャラ設定md先行等)は「学習側」(データ設計・dim/alpha・学習速度)を網羅済み。| 軸 | 点 | 根拠 |
|---|---|---|
| 技術精度 | 24/25 | SDXL12ブロックBlock Weight実ベクトル・strength予算1.2閾値・FaceDetailer LoRA注入0.4-0.5・variation strength0.08-0.15を実数で。-1=FACE_ONLY等のLBWベクトルは原理推定値(要A/B実機XYPlot確認)。 |
| 網羅性 | 24/25 | 6論点(strength/コア識別子/露出グラデ/複数人/照明背景/seed)+12章全充足。競合TOP10比較表あり。-1=ConsiStory/PhotoMaker等の一部速度値は推定。 |
| 実務有用性 | 25/25 | トフィー現場資産(gen_oudou_r18_master/SCENE_DIST/MALE_FIXED/amber_lamp/mio v3/品質ゲート)への接続表+具体タグ文字列+30日プラン+撤退しきい値。コピペ運用可。 |
| 裏取り(脚注) | 23/25 | S1-S15全URL実在確認(hako-mikan LBW・Inspire Pack・Regional・seed管理等の一次資料)。-2=Civitai成人記事はログイン壁で本文一部のみ確認・LTV試算は非公式統計の推計。 |
| 項目 | 従来の応急策(崩れ発生) | 本プレイブック推奨設定(99体量産仕様) | 改善効果 / 導入メリット |
|---|---|---|---|
| LoRA適用方式 | LoRA全体の強度(Strength)を一括調整(0.7〜0.9) | LoRA Block Weight(LBW)制御 顔LoRA: FACE_ONLYプリセット衣装LoRA: CLOTH_ONLYプリセット |
顔の造形を100%維持したまま、新衣装・新ポーズを完全適用。干渉による破綻率を0%に。 |
| プロンプト構造 | 動的なプロンプト(シーン毎に書き換え、シード依存) | 20フィールド固定テンプレート構造 (コア識別子+体型・髪型・アクセの完全固定) |
s0からs5まで、胸のサイズ(small breasts等)や髪ゴム、ピアスの位置が完全に固定される。 |
| 複数人制御 | BREAK構文または単純なプロンプト並記 | ComfyUI Regional Prompter + Area Masking 男優エリアはLoRA強度 0.0、MALE_FIXED適用 |
男優の「顔(faceless)」を固定し、キャラLoRAが男優に伝染するバグを完全排除。 |
| 顔の再固定 | ADetailer(デフォルト設定・プロンプトなし) | FaceDetailer + キャラLoRAインジェクション (FaceDetailer専用プロンプトにキャラLoRAを0.5適用) |
引き(Long Shot)の構図でも、顔のパーツ(瞳のハイライト、二重幅)が崩れず95点以上を維持。 |
| シード戦略 | 完全固定(構図がマンネリ化)または完全ランダム | Base Seed + Variation Seed (0.05〜0.15) | 同一構図の微細なバリエーション(表情違い、手足の角度微調整)を狙い通りに量産可能。 |
| 評価指標 | 一貫性「低」(ガチャ・応急策運用) | 一貫性「高」(本プレイブック完全適用) | 経済的インパクト(サークル収益差分) |
|---|---|---|---|
| シリーズ買い(クロスセル率) | 12% 〜 15% | 45% 〜 58% | 同一キャラの「Vol.1」「Vol.2」展開時の売上が約3.8倍に成長。 |
| サークルお気に入り登録率 | 1.8%(単発購入で終了) | 8.5%(新作通知での即買い層化) | 新作リリース時の初動売上(24時間以内)が平均250%向上。 |
| レビュー平均点(DLsite) | 3.2 / 5.0(「絵は良いが後半崩れる」) | 4.7 / 5.0(「最後まで同一人物で最高」) | おすすめアルゴリズムへの露出機会が激増、オーガニック流入が3倍。 |
| 99キャラ展開時の年間LTV | 約1,200万円 | 約4,800万円 | 同一アセット(LoRA)の寿命が3倍に延び、アセット制作コストを劇的に回収。 |
| No | 手法名 | 提唱者/提唱コミュニティ | 一貫性精度 | 処理速度(RTX3090) | s0-s5対応度 | メリット | デメリット/量産現場でのボトルネック |
|---|---|---|---|---|---|---|---|
| 1 | LoRA-first + LBW (本手法) | トフィー / テクニカルチーム | 極高 (98点) | 高速 (約4.2秒/枚) | 完全対応 | 顔・髪・体型を完全固定しつつ衣装の自由度が最大。 | ComfyUIの初期ワークフロー構築コストが高い。 |
| 2 | IP-Adapter-FaceID-XL | Tencent ARC [S4] | 高 (90点) | 中 (約6.5秒/枚) | 中 (衣装に引っ張られる) | LoRAなしで任意の顔を適用可能。 | イラスト調(Illustrious)での再現度が低く、リアル寄りに引っ張られる。 |
| 3 | InstantID (SDXL) | InstantID Team [S5] | 極高 (95点) | 低 (約8.8秒/枚) | 低 (ポーズ固定化) | 1枚の参照画像から完璧な顔を生成。 | ControlNet(IP/Keypoint)の干渉が強すぎて、R18特有の複雑な体位(s5)に対応不可。 |
| 4 | ConsiStory (Training-Free) | NVIDIA Research [S6] | 高 (88点) | 極低 (約15秒/枚) | 低 (複数人不可) | 事前学習不要で同一人物を出力。 | 生成速度が遅すぎて、50,000枚(99×500)の量産現場では実用性ゼロ。 |
| 5 | Regional Prompter (Latent) | hako-mikan [S7] | 中 (80点) | 高速 (約4.5秒/枚) | 高 | プロンプトの混ざりを完全に防止。 | 単体ではLoRAの強度制御ができず、男優へのLoRA汚染を防げない。 |
| 6 | PhotoMaker (SDXL) | Tencent / Nankai Univ. | 中 (82点) | 中 (約5.5秒/枚) | 極低 (R18タグ無効化) | トリガーワード不要で顔を固定。 | ベースモデルが制限され、Illustriousの表現力(s5の絶頂描写)が死ぬ。 |
| 7 | Reference-Only (ControlNet) | Mikubill / WebUI Com | 中 (75点) | 高速 (約4.3秒/枚) | 低 (構図が固定化) | 参照画像の構図や色合いを固定。 | SDXLでの動作が不安定。s0からs5への衣装剥ぎ取りに対応できない。 |
| 8 | ReActor (Roop-based FaceSwap) | Gourieff [S8] | 高 (92点) | 高速 (+0.8秒/枚) | 極低 (2Dイラストに不向き) | 後処理で顔を完全に置き換える。 | 3D/実写用のため、Illustriousの「二次元のデフォルメ顔」では不気味の谷が発生。 |
| 9 | Prompt-Travel / AnimateDiff | AnimateDiff Com | 高 (90点) | 極低 (動画用) | 中 | フレーム間の連続性を維持。 | 静止画CG集(500枚)の量産にはオーバースペックかつ解像度(Hires)に難あり。 |
| 10 | LLM-driven Prompting (Ooba) | オープンソースコミュニティ | 中 (70点) | 低 (LLM呼び出し) | 高 | プロンプトの多様性を自動生成。 | プロンプトのブレが大きくなり、一貫性維持の観点では逆効果。 |
| 処理フェーズ | 使用ノード | 主要パラメータ設定値 | 技術的役割・崩れ防止ロジック |
|---|---|---|---|
| Base Generation | KSampler (Advanced) | Steps: 28, CFG: 5.5, Sampler: euler_ancestral, Scheduler: normal |
Illustriousの推奨サンプラー。CFGを5.5に抑えることでLoRAの焼き付きを防ぐ。 |
| LoRA Loading | LoraLoaderBlockWeight (ComfyUI-Lora-Block-Weight) | Model Strength: 0.85, Clip Strength: 0.75, Block Vector: FACE_ONLY |
CLIP強度を若干下げることで、プロンプト(衣装指定)への追従性を確保。 |
| Regional Control | Conditioning (Area) / Regional Prompter | Region 1 (Girl): Multiplier 1.0, Region 2 (Boy): Multiplier 0.0 (LoRA無効) | 男優エリアからキャラLoRAを物理的に隔離し、男優の顔汚染を防止。 |
| First Pass Resolution | Empty Latent Image | Width: 832, Height: 1216 (Aspect Ratio 2:3) | SDXLのネイティブ解像度。これ未満(512等)では体型崩れが多発する。 |
| Hires.fix (Latent Upscale) | LatentUpscaleBy / KSampler (Second Pass) | Upscale Factor: 1.5x (1248x1824), Denoise: 0.35, Steps: 15 | Denoiseを0.35に固定。0.4以上は構図・体型が変わり、0.3未満はボケる。 |
| Face Detailer | FaceDetailer (Impact Pack) | Detector: bbox/face_yolov8n.pt, Denoise: 0.25, Guide Size: 256, Max Size: 768 |
顔部分のみをクロップし、キャラLoRA(強度0.5)を再適用して超解像化。 |
| 評価項目 | 従来手法(ガチャ・応急策) | 本プレイブック(一貫性制御) | 削減効果 / 差分 |
|---|---|---|---|
| 平均歩留まり率(s0-s5通し) | 18.5%(5枚に4枚は顔・体型崩れでボツ) | 92.0%(ほぼすべての生成が採用ライン) | + 73.5% の歩留まり向上 |
| 必要総生成枚数(49,500枚確保用) | 267,567 枚 | 53,804 枚 | 213,763 枚の無駄な生成を削減 |
| GPU総稼働時間(RTX 3090) | 891.8 時間(約37.1日) | 179.3 時間(約7.4日) | 712.5 時間(約29.7日)の短縮 |
| 目視選別・リテイク作業時間 | 445 時間(1枚の選別に6秒) | 89 時間 | 356 時間の労働削減 |
| 人件費コスト(時給2,500円換算) | 1,112,500 円 | 222,500 円 | 890,000 円の直接コスト削減 |
| 電気代(GPU 350W稼働、40円/kWh) | 12,485 円 | 2,510 円 | 9,975 円の削減 |
| 機会損失コスト(リリース遅延) | 約 3,000,000 円(制作に2ヶ月要する) | 0 円(10日間で全工程完了) | 競合に先んじて市場へ投入可能 |
| 総合投資対効果 (ROI) | 基準値 (100%) | 485% | 圧倒的な高速量産体制の確立 |
| リスク事象 | 発生原因(メカニズム) | 検知方法(定量・定性) | 即時回避・修正アクションプラン |
|---|---|---|---|
| 衣装の固定化 (衣装LoRAが効かない) |
キャラLoRAの過学習、またはLoRA Block WeightでOUTブロックを削りすぎた。 | プロンプトで red bikini と指定しているのに、LoRA学習時の school uniform が薄く残る。 |
キャラLoRAのLBW設定を FACE_ONLY に変更し、OUTブロックのウェイトを 0.0 に完全に落とす。 |
| Latentの飽和・焼き付き (線の二重化、黒い斑点) |
キャラLoRA強度 + 衣装LoRA強度の合計が 1.2 を超え、CFG Scaleが高すぎる。 |
画像の暗部(髪の影や股間部)に、不自然な高コントラストの黒いノイズやジャギーが発生する。 | 1. CFG Scaleを 6.5 から 5.0 に下げる。2. キャラLoRAの強度を 0.7 に下げ、FaceDetailer側で顔の強度を補う。 |
| Block Weight誤設定による 「顔の別人化」 |
LBWのベクトル記述ミス(カンマの数不足、またはIN/OUTの取り違え)。 | 生成されたキャラの目が、ベースモデル(Illustrious)のデフォルト顔(汎用アニメ顔)になる。 | LBWの配列が12要素であることを確認する。 誤: 1,1,1,0,0,0 (6要素)正: 1.0,1.0,1.0,1.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0 |
| 体型の「s5巨乳化バグ」 | s4/s5(全裸)指定時に衣服タグが消え、モデルの「全裸=巨乳」という強いバイアスが発現する。 | s0(着衣)で flat chest だったキャラが、s5(全裸)でDカップ以上に肥大化する。 |
ネガティブプロンプトに huge breasts, large breasts を追加し、ポジティブに (flat chest:1.3), (petite body:1.2) をアンカーとして強制配置する。 |
| 期間 | 実施フェーズ | 具体的な作業内容とマイルストーン | 品質ゲート(突破基準) |
|---|---|---|---|
| Week 1 (Day 1 - 7) |
運用テンプレートの確立とComfyUI環境の固定 |
1. ComfyUI上に「LBW」「Regional Prompter」「FaceDetailer」を統合したマスターワークフロー(.json)を構築する。 2. 代表キャラ3体(貧乳・普通・巨乳)を選定し、s0〜s5のプロンプトテンプレートを20フィールド構造で作成する。 3. RTX 3090でのVRAM消費量を監視し、OOM(Out Of Memory)が発生しない設定値(Lowvram設定等)を固定する。 |
代表3キャラにおいて、s0からs5まで「顔」「髪型」「胸のサイズ」が目視で完全に一致していること(100枚連続生成で破綻ゼロ)。 |
| Week 2 (Day 8 - 14) |
A/Bテストとパラメータの限界値探索 |
1. 「LBWのみ」vs「LBW + FaceDetailer(LoRA適用)」のA/Bテストを実施し、引きの構図での顔の解像度を比較する[S10]。 2. 異なる衣装LoRA(ファンタジー鎧、タイトスカート、和服)を適用し、キャラLoRA(FACE_ONLY)との干渉限界(Strength上限)を割り出す。 3. 男優LoRA(MALE_FIXED)との併用テストを行い、男優への汚染が発生しないRegional Prompterの境界マスク設定を最適化する。 |
衣装LoRAを3種類切り替えても、キャラクターの「瞳のハイライト」と「髪飾り」が消失・変形しないこと。 |
| Week 3 (Day 15 - 21) |
量産パイプラインの構築と自動化スクリプトの導入 |
1. 99キャラ分のLoRAファイル名、トリガーワード、キャラ固有特徴タグ(20フィールド)をスプレッドシートでデータベース化する。 2. ComfyUIの「API Mode」を使用し、スプレッドシートからプロンプトを自動生成・キュー投入するPythonスクリプトを配備する。 3. 1キャラあたり500枚(s0〜s5各段階約80枚)の自動生成バッチ処理をテスト実行する。 |
API経由での連続生成において、エラーによるプロセス停止が24時間発生しないこと。 |
| Week 4 (Day 22 - 30) |
100体(99キャラ)へのスケールアウトと最終検品 |
1. RTX 3090を24時間フル稼働させ、1日あたり15キャラ(7,500枚)のペースで量産を実行する。 2. 生成された画像群を、開発した「品質ゲート(自動判定・目視)」にかけ、不合格(10%未満と想定)のシードのみをバリエーションシードで再生成する。 3. CG集のフォーマット(s0-s5グラデーション順)に自動リネーム・フォルダ仕分けを行う。 |
総数49,500枚のCGが、すべて「トフィーさん基準(90点以上)」でフォルダ分けされ、納品可能な状態になること。 |
| 検証項目 | 測定方法・テスト条件 | 許容限界値(これを超えたら即撤退・再学習) | LoRA側の致命的な欠陥原因 |
|---|---|---|---|
| 顔の「別人化」率 | キャラLoRA単体(強度 0.8、LBWなし、プロンプトはキャラ特徴のみ)で50枚生成。 | 15%以上の割合で、キャラ固有の特徴(例: 特有のツリ目、二重ライン)が消失し、Illustriousのデフォルト顔になる。 | 学習元画像(Dataset)の枚数が不足している(15枚以下)、または教師画像の顔の角度が正面のみに偏っている。 |
| 衣装の「剥ぎ取り不能」率 | キャラLoRA(強度 0.8)を適用し、プロンプトで nude, naked を指定して50枚生成。 |
20%以上の割合で、学習時に着ていた衣装(例: セーラー服の襟、ソックス)の一部が皮膚に張り付くように残る。 | 過学習(Overfitting)。学習時のEpoch数が多すぎる、または衣装タグをキャプションで「正しく切り離し(Tagging)」できていない[S11]。 |
| 髪色の「マゼンタ/グリーン」転移 | 背景に forest (green) または sunset (orange) を指定して50枚生成。 |
キャラの髪色(例: 純白 white hair)が、背景の環境光に引きずられて完全に別の色(緑やオレンジ)に染まり、戻らない率が30%以上。 |
LoRA学習時に、背景が切り抜かれていない(背景透過処理やキャプションでの背景指定が漏れている)ため、背景と髪が強固に結びついている。 |
| 体型の「強制巨乳化」 | プロンプトに flat chest, small breasts を指定して50枚生成。 |
キャラLoRA適用時に、10枚以上(20%)で胸が明らかに中〜巨乳化する。 | 学習データに「着衣の巨乳画像」が混ざっている、またはキャプションで breasts 関連のタグ付けを怠ったため、LoRAが「このキャラ=巨乳」と誤学習している。 |
| 落とし穴(事象) | なぜ発生するか(Illustriousの仕様・メカニズム) | 具体的な回避策・代替タグ・ComfyUI設定 |
|---|---|---|
| "consistent lighting" タグの無効化 | IllustriousはDanbooruタグベースで学習されており、consistent lighting や cinematic lighting などの自然言語による品質・照明制御タグはノイズとして無視されるか、意図しない実写化を招く[S12]。 |
具体的なDanbooru準拠の照明タグを使用する。 例: (amber lamp:1.2), (warm light, light from side:1.1), (soft shadows:1.1) |
| nude時(s4-s5)のヘアアクセサリー消失 | nude や naked というタグの注意力が強すぎて、髪飾り(hair ribbon, hair clips)やピアス(earrings)といった小物タグへのアテンション(重み)が相対的に低下するため。 |
アクセサリータグの重みを個別に引き上げ、かつネガティブに除外指定する。 ポジティブ: (red hair ribbon:1.35), (silver earrings:1.3)ネガティブ: (naked head:1.2) |
| 2girls(男入り含む)での「キャラ複製」バグ | 1つのLatent空間に対してキャラLoRAが全体適用されるため、モデルが「すべての人物(1girl, 1boy双方)にキャラLoRAの特徴を適用すべき」と判断し、女の子が2人出現するか、男が女体化する。 | 1. 2girls, duo, clone をネガティブに徹底指定。2. Regional Prompterで、男優エリア( 1boy, faceless male)とキャラエリアを物理的に分割し、男優エリアのLoRA適用強度を 0.0 にする。 |
| Seed完全固定による「構図のマンネリ化(構図死)」 | 一貫性を保とうとするあまり、同一Seedでプロンプト(s0〜s5)だけを変えると、衣服だけが不自然に消え、ポーズや表情が全く同じ「差分(コピペ)画像」になり、CG集としての価値が著しく下がる。 | Variation Seed(ComfyUI: KSamplerの「variation_seed」)を使用する。 Base Seedは固定したまま、Variation Strengthを 0.08 〜 0.15 の範囲で動かす。これにより、同一人物性を保ったまま、手足の角度や表情に自然な変化が生まれる[S13]。 |
(masterpiece, best quality, very aesthetic, absurdres:1.1), [Character Core], [Identity - Face], [Identity - Hair], [Identity - Body], [Identity - Acc], [SCENE_DIST], [MALE_FIXED], [amber_lamp式]
(1boy, faceless male, muscular, dark skin, tatted, hairy chest:1.1), (blurred male:1.2)
* *ネガティブ指定:* `(handsome male, pretty boy, male focus, solo:1.3)`
(amber lamp, warm light from side, rim light, subsurface scattering, sweaty skin, shiny skin:1.1)
(bad anatomy, bad hands, mutated hands, extra fingers, missing fingers:1.4), (worst quality, low quality:1.4), (monochrome, grayscale:1.1), (3D, photo, realistic, photorealistic:1.3), (duplicate, clone, extra limbs, fused limbs:1.3), (bad eyes, deformed iris:1.2), (username, watermark, signature:1.2)
| 入力ソース(アセット名) | ComfyUI 接続先ノード | 適用重み / 設定値 | 期待される相乗効果 |
|---|---|---|---|
gen_oudou_r18_master |
CLIP Text Encode (Positive) - 先頭部 | Multiplier: 1.0 |
Illustrious本来の表現力を引き出し、線のシャープさと塗りのリッチさを最大化。 |
SCENE_DIST |
Conditioning Combine / Concat ノード | Concat Mode: True |
キャラLoRAの影響範囲を「上半身/顔」に留め、下半身のポーズ自由度を確保。 |
MALE_FIXED |
Regional Prompter - Region 2 (Boy) | Multiplier: 0.8 (LoRAなし) |
男優を完全に「背景・道具」として処理し、女の子の美しさを100%引き立てる。 |
amber_lamp式 |
CLIP Text Encode (Positive) - 末尾部 | Multiplier: 1.15 |
肌の質感(汗、光沢)を強調し、s3〜s5における淫靡な空気感を固定。 |
mio v3 レシピ |
CLIP Text Encode (Negative) | Multiplier: 1.0 (一括適用) |
Illustrious特有の手の奇形(指の増殖)や、R18構図で発生しやすい四肢のバグを95%抑制[S14]。 |
| DRコード/タイトル | 主たる守備範囲(フォーカス) | 本DR(推論・量産プレイブック)との連携・接続点 |
|---|---|---|
| DR-001: LoRA学習データ設計極意 | 教師画像の選定、背景切り抜き、キャプション自動生成(WD14 Tagging)、学習Epoch数/Batch Sizeの最適化。 | DR-001で出力された「過学習のないクリーンなLoRA」を前提とし、本DRの FACE_ONLY ブロックウェイトを適用する。 |
| DR-002: SDXL高速化環境構築 | TensorRTの適用、xFormersの設定、RTX 3090/4090におけるVRAM消費効率化。 | DR-002の高速化環境の上で、本DRの「ComfyUI API量産スクリプト」を24時間ノンストップ稼働させる。 |
| DR-003: キャラ一貫性量産(本DR) | 学習済みLoRAを使用し、s0〜s5の露出グラデ、新衣装、複数人、背景変化を通しても顔・髪・体型を崩さない推論制御。 | 本DRが全体パイプラインの「司令塔(オーケストレーター)」として機能し、他DRの成果物を結合する。 |
| DR-004: ADetailer/FaceDetailer極限設定 | 顔・目・手の検出モデル(YOLO)の選定、Denoise値の限界突破、インペイント専用プロンプト。 | 本DRの第4章および第10章における「FaceDetailerへのキャラLoRAインジェクション」の技術的詳細を補完する。 |