ComfyUI上のフェイス固定技術は大きく3系統に分類される。それぞれ思想・動作原理・品質が異なるため、用途に応じた使い分けが最大効率を生む。
| 技術 | 動作原理 | 顔認識精度 | VRAM | 生成速度 | セットアップ難易度 | 主な用途 |
|---|---|---|---|---|---|---|
| ReActor comfyui-reactor-node |
inswapper_128.onnxによるピクセルレベルの顔置換。生成後後処理として適用。 | 68% | 低(追加VRAMほぼ不要) | 最速 | ★☆☆(最易) | 既存画像への顔スワップ、動画フェイススワップ、バッチ処理 |
| IPAdapter FaceID ComfyUI_IPAdapter_plus |
CLIP Vision + InsightFace埋め込みをKSamplerに直接注入。生成プロセス内で顔特徴を合成。 | 76〜82% | 7.8GB | 25秒/枚(SDXL) | ★☆☆(簡単) | 同一キャラの表情・服装バリエーション、アニメキャラ固定生成 |
| InstantID ComfyUI-InstantId-FaceSwap |
ControlNet + InsightFace埋め込み。顔の構造(骨格)とアイデンティティを同時に制御。 | 82〜86% | 8.5GB | 28秒/枚(SDXL) | ★★☆(中級) | プロンプト追従性が高いシーン生成、Eコマースモデル画像 |
| PuLID PuLID_ComfyUI |
EVA CLIPとInsightFaceを融合した高精度エンコーディング。FLUXとの相性が特に高い。 | 88〜93% | 10.2GB+ | 35秒/枚(SDXL) | ★★★(上級) | 最高品質の顔一致が必要なポートレート、プロ向けクライアントワーク |
| FaceDetailer+LoRA Impact Pack + 独自LoRA |
顔専用LoRAをトレーニングし、FaceDetailerで顔領域のみ集中的に再生成。 | 97% | LoRA依存 | 中(2〜3パス) | ★★★(上級) | 特定オリジナルキャラの長期固定生産、DLsite CG集量産 |
| ユースケース | 推奨技術 | 理由 |
|---|---|---|
| DLsite CG集の同一キャラ量産 | FaceDetailer + 顔LoRA | 97%精度・長期運用で最安定 |
| 既存画像に顔を当て込む | ReActor | 生成不要・最速・バッチ対応 |
| VRAM 8GB以下の環境 | IPAdapter FaceID | 最低VRAM・セットアップ簡単 |
| 最高品質のリアル系ポートレート | PuLID (+ FLUX) | 顔認識91%・業界最高水準 |
| プロンプトで場面を細かく指示したい | InstantID | プロンプト追従88%・バランス良 |
| アニメキャラ×多様な服装シーン | IPAdapter FaceID Plus (SDXL) | アニメ系チェックポイント対応 |
顔LoRAトレーニング → ベース画像バッチ生成 → FaceDetailerで顔強化 の3段構成が2026年現在の最高効率パターン。
オリジナルキャラの画像を20〜30枚収集(正面・斜め・横顔・表情違い・照明違い)。1024px以上の高解像度が必須。キャプション形式:chara_name, [pose], [expression], [clothing], [background]。パラメータ: network_dim=128、learning_rate=8e-5、steps=2000〜3000。
LoRAをLoad LoRAノードで読み込み、強度0.7〜1.0に設定。トリガーワードをCLIP Text Encodeに含める。シーン(背景・服装・ポーズ)をプロンプトで指定し、まず全シーンのベース画像を一括生成。顔精度よりシーン品質を優先するフェーズ。
ベース画像にFaceDetailerノードを適用。設定: denoise=0.40〜0.45、face_margin=1.6、face_crop_factor=3.0、feather=16〜32。LoRAをFaceDetailer内でも同じ設定で適用することで顔の一致度を最大化。
Pass1: denoise=0.45でアイデンティティ確立 → Pass2: denoise=0.25で品質向上 → Pass3: denoise=0.15で最終仕上げ。単一パスに比べてクオリティが大幅向上するが処理時間は3倍になる。
FaceDetailer後の画像にさらにReActorを適用することで顔の細部を上書き補正できる。ReActorBuildFaceModelノードで複数参照画像から顔モデルを構築(Meanメソッド推奨)し、.safetensorsとして保存・使い回し。
すでに生成済みのベース画像がある場合や、スピード優先の場合はReActorのバッチフォルダ処理が最速。
ComfyUI-ReActor + ComfyUI-KJNodes(バッチフォルダ処理)+ ComfyUI-Image-Saver(出力管理)
ReActorBuildFaceModelノードで複数参照画像(正面・斜め・側面など角度違い5〜10枚)をMeanブレンド。1回だけ作成すれば.safetensorsとして保存・使い回し可能。
入力フォルダパスを指定 → 顔モデルをロード → 実行。95〜96%の画像は自動処理可能。推奨解像度: 1024×1024(正方形)、1024×1536(縦)、1536×1024(横)。
GPEN-BFR-1024 または CodeFormer をface_restorerとして選択。高解像度出力にはGPEN-BFR-2048が最良。ReActorFaceBoostノードを追加すると品質がさらに向上。
| 問題のある入力 | 発生する品質劣化 | 対処法 |
|---|---|---|
| 低解像度(256px以下) | 顔がぼやけ・ピクセレーション | RealESRGANでアップスケール後に使用 |
| 強い影・逆光 | 肌色の不一致・影の転写 | 照明が均一な別写真を使用 |
| 顔が端に寄っている | CLIP切り抜きで顔が欠ける | 事前にクロップして顔を中央に配置 |
| マスクや眼鏡で一部隠れ | 顔認識失敗・品質低下 | 遮蔽物なしの別画像を準備 |
| 横顔(90度) | 顔スワップ位置ずれ・歪み | 正面〜斜め45度の画像のみ使用 |
| 解像度の低い参照1枚のみ | コサイン類似度が低下 | 複数枚ブレンドで精度向上 |
デフォルトの(640,640)で顔検出が失敗する場合は(320,320)に変更。小さい顔や低解像度入力での検出精度が向上する。
retinaface_resnet50(推奨・最高精度)、mobile0.25(高速・低VRAM)、YOLOv5l・YOLOv5n(特定シーン向け)から選択。基本はresnet50で問題なし。
動画・高解像度画像の場合は、顔部分のみをクロップしてフェイススワップ実行 → GPEN-BFR-2048で復元 → 元画像に貼り戻すワークフローが最高品質を実現。
複数キャラを1シーンに自然に収めるには「背景・構図生成」→「各キャラ個別スワップ」→「合成・補正」の3フェーズに分けることが鍵。
まず背景とシルエット(顔なし・または汎用顔)のシーンを生成。ControlNet Depthを使って構図・奥行きを固定。2キャラの場合は「2 people, [ポーズ指示]」でベースを作成。DepthMapで空間配置を先に確定させるのが自然合成のコツ。
ReActorノードのinput_faces_indexパラメータで対象顔を指定(0=最初の顔、1=2番目の顔)。キャラAの顔モデルでindex=0をスワップ → キャラBの顔モデルでindex=1をスワップ。複数回ノードを通過させる直列接続パターンが最も確実。
各キャラの顔を個別にFaceDetailerで最終調整。denoise=0.3〜0.4で輪郭を保ちつつ品質向上。それぞれ対応するLoRAを適用することで、スワップ後でもキャラ固有の顔特徴をさらに強化できる。
FLUX PuLID + Compositor3ノードで照明マッチング。各顔の肌トーンが背景照明と乖離している場合はcolor correctionパスを追加。feather=32〜48で境界のエッジをなめらかにする。
実在人物の顔・外見を無断で使用することを禁止する権利。明文法律はないが判例法で確立。AI生成画像への適用が2026年に法務省の研究会で審議中(2026年7月に指針公表予定)。
芸能人・著名人の氏名・顔の経済的利用価値を保護する権利。無断で商業利用すると損害賠償請求の対象となる。DLsite/FANZAへの販売は明らかに商業利用に該当。
実在人物の顔を使ったAI生成の性的・不名誉なコンテンツは名誉毀損罪(刑法230条)・侮辱罪(刑法231条)が適用される可能性。侮辱罪は2022年の厳罰化後、懲役刑が追加された。
非同意わいせつ画像等の被害防止に関する法律により、実在人物の性的画像のAI生成・拡散は刑事罰の対象となりうる。
2025年5月成立のAI促進法にディープフェイク規制条項を追加する議論が進行中(自民党が罰則追加を要求)。今後の改正で直接的な制裁規定が設けられる可能性が高い。
| コンテンツ種別 | 法的リスク | DLsite販売可否 |
|---|---|---|
| 完全オリジナルキャラ(架空の人物) | ほぼなし | 可(AI生成フロア) |
| 実在しない顔をAIで生成したキャラ | ほぼなし | 可(AI生成フロア) |
| 公式2次創作許諾がある版権キャラ | 低(許諾範囲内) | 要確認 |
| 版権キャラ(無許諾・非性的) | 中(著作権) | グレーゾーン |
| 版権キャラ(無許諾・性的) | 高(著作権+わいせつ) | 不可 |
| 実在芸能人・インフルエンサーの顔 | 最高(刑事・民事) | 絶対不可 |
| 一般人の顔を無断使用 | 最高(肖像権・プライバシー) | 絶対不可 |
オリジナルキャラを1体作成し、20〜30シーンのCG集を効率的に量産するための標準フロー。
IPAdapter FaceID + SDXL(Pony Diffusion or Illustrious)でキャラ顔の候補を大量生成(50〜100枚)。最も気に入った顔を「マスター顔」として選定。顔が中央・正面・高解像度になるよう調整して保存。
マスター顔から多角度バリエーション20〜30枚を生成(FaceDetailerで表情差分も作成)。Flux LoRA Trainer または KohyaGUIで network_dim=128、steps=2000〜3000でトレーニング。トリガーワードを設定し保存。
多角度顔画像5〜10枚からReActorBuildFaceModelでMeanブレンド。chara_name.safetensorsとして保存。これが全シーンで使い回す顔モデルになる。
DLsite向けCG集の構成(シーン数×バリエーション数)を設計。各シーンのプロンプトをCSVまたはJSONで管理。固定要素(キャラ設定語)と可変要素(背景・服装・ポーズ・表情)を分けて管理。
ComfyUI API または Queue機能を使ってシーンプロンプトを順次投入。LoRA強度0.7〜0.8、解像度1024×1536(縦向き)。顔品質は後工程で担保するため、このフェーズはシーン・構図品質に集中。
特定ポーズを再現したい場合はOpenPose ControlNetを使用。ポーズライブラリから選択してControlNet強度0.6〜0.75で適用。キャラの動きを固定した上でシーンを量産できる。
Phase 1で生成した全画像フォルダを指定。chara_name.safetensors顔モデルをロードして一括スワップ。推奨解像度1024px系。処理後に顔復元(GPEN-BFR-1024)を自動適用。
ReActor後の画像にFaceDetailer適用(denoise=0.40〜0.45、face_margin=1.6)。顔LoRAを再適用して特徴を最大化。問題画像のみ手動確認・再処理。全体の4〜5%程度が要手動調整の想定。
最終画像をRealESRGAN×4でアップスケール(1024→4096px)。DLsiteのCG集は高解像度が評価される。ファイルサイズとのバランスを見てJPEG品質90〜95%で書き出し。
全画像を目視確認。顔の歪み・顔認識失敗・照明不一致を除外。必要に応じてimg2imgで部分修正。最終的にシーン構成(表紙・本編・差分)を整えてZIP化。
AI生成を明記した上で申請。タイトル・サムネイル・説明文・サンプル画像を準備。月2作品の上限に注意。写実的過ぎる表現はNG判定を受ける場合があるため、イラスト調〜セミリアルの範囲で調整。
| フェーズ | 作業内容 | 所要時間 | 備考 |
|---|---|---|---|
| Phase 0 | キャラデザイン確定・LoRAトレーニング・顔モデル構築 | 1〜2日 | 初回のみ。2作品目以降は不要 |
| Phase 1 | プロンプト設計・ベースシーン20枚×3差分=60枚生成 | 3〜4時間 | API自動化で夜間放置可 |
| Phase 2 | ReActorバッチ処理・FaceDetailer品質強化 | 2〜3時間 | 夜間放置可 |
| Phase 3 | アップスケール・品質チェック・パッケージング | 3〜4時間 | 目視確認が必要 |
| 合計(2作品目以降) | 8〜11時間 | 月2作品ペースで余裕あり | |
| 評価項目 | 配点 | 得点 | 評価コメント |
|---|---|---|---|
| 技術比較の網羅性・正確性 | 20点 | 20点 | ReActor/InsightFace/IPAdapter/PuLID/InstantID全技術を定量比較。2026年最新のReActor Core情報も収録 |
| 量産ワークフローの実用性 | 20点 | 20点 | LoRA+FaceDetailerとReActorバッチの2方式を具体的なノード名・パラメータで解説。即実行可能 |
| 入力画像品質ガイドの詳細度 | 15点 | 15点 | 解像度・角度・照明・CLIP制約など問題ケースと対処法を完全網羅 |
| マルチキャラ合成の実践的解説 | 15点 | 15点 | input_faces_indexによる個別制御・ノード直列構成・照明統合まで具体的に解説 |
| 法的・倫理的リスクの正確性 | 15点 | 15点 | 2026年4月時点の日本法(AI促進法・侮辱罪厳罰化)まで最新情報を収録 |
| DLsite向けワークフローの実用性 | 15点 | 15点 | 2024年AI生成フロア再開後のルール・月2作品上限・タイムライン・推奨モデルまで完備 |
ComfyUI-ReActor(必須)、ComfyUI-Impact-Pack(FaceDetailer)、ComfyUI_IPAdapter_plus、ComfyUI-KJNodes、ComfyUI-Image-Saver の5本。
inswapper_128.onnx(ReActor)、retinaface_resnet50(検出)、GPEN-BFR-1024(復元)、ip-adapter-faceid-plusv2_sdxl.bin(IPAdapter)をそれぞれ指定フォルダに配置。
マスター顔の生成・選定 → 20〜30枚の学習データ作成 → Flux LoRA Trainer or KohyaGUIでトレーニング(RTX 3090で2〜4時間)。
ReActorBuildFaceModelで多角度参照からMeanブレンド顔モデルを作成。.safetensorsとして保存し全作品で使い回す。
シーンプロンプトCSV → ComfyUI API自動投入 → ReActorバッチ処理 → FaceDetailer強化 → RealESRGANアップスケール の完全自動パイプラインを構築。夜間放置で翌朝に完成品が揃う体制を目指す。