DR: ComfyUI LoRAトレーニング・活用完全ガイド 2026年版

1

教師データの枚数・品質・前処理方法

必要枚数の目安

「枚数より品質」が現在の定説です。低品質な100枚より、高品質な20〜30枚のほうが優れたLoRAができます。

用途	最小枚数	推奨枚数	備考
アニメキャラクターLoRA	10枚	20〜40枚	角度・表情・衣装のバリエーション必須
リアル人物LoRA	20枚	30〜50枚	顔アップ多め、異なる照明条件で
スタイルLoRA	30枚	50〜200枚	スタイルの汎化には多めのデータが必要
オブジェクト・衣装	15枚	30〜50枚	多角度・異なる背景で撮影

50枚を超えてもほとんど改善しないケースが多い。むしろ過学習（overfitting）のリスクが高まるため、枚数追加より品質向上を優先すること。

画像品質の基準

✓ 使うべき画像

解像度1024px以上（SDXL/Illustrious用）
ピンボケ・圧縮アーティファクトなし
多様な背景・角度・表情
対象が画面の中心にある
PNG形式（JPEGは可だが非推奨）

✗ 避けるべき画像

スクリーンショット・低解像度
フィルター処理済み（SNS加工済み）
同一背景ばかりの画像セット
対象が小さく映っている
他のキャラが一緒に写っている

前処理ステップ（推奨フロー）

① 画像収集

→

② アップスケール

→

③ クロッピング

→

④ キャプション付け

→

⑤ フォルダ構成

② アップスケール

kohya_ssはPillowで自動アップスケールしますが品質が低いため、事前に手動アップスケールが推奨です。

Remacri（汎用） RealESRGAN 4x Anime 6B（アニメ向け） Waifu2x（軽量）

③ クロッピング

顔中心の1:1クロップを別途追加すると、顔の再現精度が大幅向上
バスト・全身・顔アップの3パターンをバランスよく用意する
アニメの場合：anime-face-detectorで自動クロップが可能
非対称キャラ（片目や非対称な髪飾り）はフリップ禁止

④ キャプション付け（最重要）

キャプションの質がLoRA品質を決定します。以下の3方式から選択またはハイブリッド運用：

方式	ツール	特徴	向いている用途
Danbooruタグ方式	WD14 Tagger	アニメ画像に特化・高精度なタグ自動生成	アニメキャラ・イラスト系
自然文キャプション	JoyCaption / BLIP2	文章形式で詳細な説明が可能	リアル系・スタイルLoRA
手動キャプション	テキストエディタ	最も精度が高い・工数大	高品質なLoRA制作
ハイブリッド	WD14 + JoyCaption	タグ+文章の両方の強みを活用	2026年の最新ベストプラクティス

アニメ用の推奨キャプション戦略：
WD14 Taggerで自動タグ生成 → トリガーワードを先頭に配置（Keep Tokens=1で固定）→ 不要タグを手動削除 → キャラ固有要素（hair color, eye color, outfit）は必ず残す

⑤ フォルダ構成

kohya_ss フォルダ構成例

training_data/
  └── 20_mycharacter/        ← 数字がリピート数（20回繰り返し）
      ├── image001.png
      ├── image001.txt        ← キャプションファイル（同名.txt）
      ├── image002.png
      └── image002.txt

リピート数 × 画像枚数 = 総ステップ数（1エポック）になります。例：20リピート×30枚=600ステップ/エポック。ステップ数の調整はリピート数またはエポック数で行います。フリップ拡張を使う場合はリピート数を2にしてください（実質倍増するため）。

2

kohya_ss / SimpleTuner / OneTrainer 比較と最適設定

ツール比較表

項目	kohya_ss	SimpleTuner	OneTrainer
対応モデル	SD1.5, SDXL, Illustrious, FLUX（musubi-tuner経由）	FLUX.1, FLUX.2特化（SD3.5も対応）	SD1.5, SDXL, FLUX Dev
UI	Web GUIあり（使いやすい）	CLIベース（JSONコンフィグ）	デスクトップGUI（直感的）
VRAM要求	SDXL：10GB〜（bf16+fused backward使用時）	約20GB（Optimum-Quanto使用時削減可）	10.3GB〜（最適化プリセット使用時）
マスクトレーニング	アルファマスク対応	非対応	◎ 最強（背景分離が精密）
SDXL/Illustrious	◎ 最も実績あり	△ 非特化だが動作可	○ 良好（写実系は特に高品質）
FLUX.2対応	△ musubi-tuner経由	◎ ネイティブ対応（15〜25%高速）	○ TE保存に制約あり
学習の汎化性	◎ 多様プロンプトで優秀	○ 安定した結果	○ 写実系特に良好
初心者向け	○ GUIで敷居低め	△ CLI操作が必要	◎ GUIが直感的で最も簡単
コミュニティ	◎ 最大・情報豊富	○ 成長中	○ 活発

用途別推奨ツール

アニメ・Illustrious XL系LoRA制作（RTX3090環境）：→ kohya_ss 一択
実績・情報量・設定の柔軟性が圧倒的。SDXL/Illustrious系の最適化が最も進んでいる。

FLUX.2モデルのLoRA：→ SimpleTuner
ネイティブ対応で最も安定・高速。

背景を除いたマスクトレーニングが必要：→ OneTrainer
特定部位だけを学習させる精密なマスク機能が強み。

kohya_ss 推奨設定（SDXL/Illustrious用）

キャラクターLoRA 基本設定

Base ModelIllustrious-XL-v2.0.safetensorsまたはNoobai等Illustrious派生

Training Resolution1024×1024Enable Buckets: ON でマルチ解像度対応

Train Batch Size1〜2VRAM 24GBなら2推奨

Max Train Steps1500〜30001500から始めて過学習確認

UNET Learning Rate1e-4 〜 3e-40.0001〜0.0003

Text Encoder LR5e-5 〜 3e-5UNETの1/10が目安

LR Schedulercosine_with_restarts安定した収束に最適

OptimizerAdamW8bitVRAM節約・安定。Prodigyは自動LR調整

Network Rank (DIM)32〜64複雑なキャラは64、シンプルなら32

Network Alpha1 または DIM/2Alpha=1が2026年の最新推奨

Clip Skip1旧ガイドの2は非推奨（2025年以降）

Min SNR Gamma5デフォルト値で十分

Shuffle CaptionsONKeep Tokens=1（トリガーワード固定）

Flip Augmentation非対称キャラはOFF対称キャラのみON可

Mixed Precisionbf16fp16より安定（Ampere以降のGPU推奨）

Prodigyオプティマイザーを使う場合： LRを1.0に設定してください。Prodigyは自動的に最適LRを算出するため、UNET LR・TE LRの細かい設定が不要になります。初心者にも扱いやすい選択肢です。

学習ステップの確認ポイント

500〜1000ステップ： 中間チェックポイントを保存（Save Every N Steps設定）
過学習の兆候： 手の形がおかしい・腕が消える・特定ポーズしか生成できない
学習不足の兆候： 特徴が弱い・トリガーワードへの反応が薄い
Ideal： キャラの特徴を維持しつつ多様なポーズ・背景に対応できる状態

3

キャラクターLoRA vs スタイルLoRA：設定の違い

根本的な違い

キャラクターLoRAは「誰であるか」を学習させ、スタイルLoRAは「どのように描くか」を学習させます。目的が異なるため、最適なパラメーターも大きく異なります。

設定項目	キャラクターLoRA	スタイルLoRA
Network Rank (DIM)	32〜64（複雑なキャラは64〜128）	16〜64（高すぎると内容暗記になる）
Network Alpha	DIM/2 または 1	DIM/2（保守的な影響が安定）
Training Steps	1,000〜3,000ステップ	2,000〜8,000ステップ（汎化に多く必要）
Learning Rate	1e-4 〜 3e-4（低め）	3e-4 〜 8e-4（高め）
データセット枚数	20〜40枚	50〜200枚（多様性重要）
学習対象レイヤー	Attentionレイヤーのみで十分	FF層も含めると質感表現が向上
キャプション方式	Danbooruタグ（WD14）推奨	自然文（JoyCaption）推奨
データの多様性	角度・表情・衣装のバリエーション	様々なシチュエーション・被写体のスタイル統一
過学習リスク	特定ポーズへの固定化	特定の構図・被写体への固定化

キャラクターLoRA 詳細設定

Network Rank32〜64

Network Alpha16〜32（DIM/2）

UNET LR1e-4 〜 3e-4

TE LR1e-5 〜 3e-5

Steps1,500〜3,000

Dataset20〜40枚

CaptionWD14タグ

スタイルLoRA 詳細設定

Network Rank16〜64

Network Alpha8〜32（DIM/2）

UNET LR3e-4 〜 8e-4

TE LR3e-5 〜 8e-5

Steps2,000〜8,000

Dataset50〜200枚

CaptionJoyCaption / BLIP2

キャプション戦略の違い（重要）

キャラクターLoRA： キャラ固有の視覚的特徴をキャプションから除外します。例えばキャラの「青い髪」「赤い目」をキャプションに書かずに学習させることで、モデルがその特徴を「そのキャラのもの」として学習します（トリガーワードで呼び出す設計）。

スタイルLoRA： 画像の内容（被写体、構図、要素）は詳細にキャプション記述します。スタイル的特徴（線の細さ、色使い、陰影表現）はキャプションに書かないことで、モデルがスタイルの特徴として学習します。

4

SDXL / Illustrious系モデル用LoRAの最適 Rank / Alpha 設定

Rank（DIM）とAlphaの基本理解

RankはLoRAが学習できる「情報量の上限」です。Alphaは実際の学習影響度のスケールを制御します。

実効スケール = Alpha / Rank
Rank=32, Alpha=16 の場合、実効スケール = 0.5（控えめな影響）
Rank=32, Alpha=32 の場合、実効スケール = 1.0（標準的な影響）
Rank=32, Alpha=1 の場合、実効スケール ≒ 0.03（最小限の初期影響・Prodigy最適化向け）

SDXL / Illustrious XL 推奨設定チャート

キャラクターの複雑さ	Network Rank	Network Alpha	ファイルサイズ目安	用途例
シンプル（顔・基本衣装のみ）	4〜8	4〜1	5〜15MB	単純なコンセプト、基本顔立ち
標準（キャラ全体・普通の衣装）	16〜32	8〜16	30〜70MB	一般的なアニメキャラ
複雑（多彩な衣装・アクセサリー）	48〜64	24〜32	70〜120MB	ゲームキャラ・詳細なオリジナル
超複雑（複数衣装・細密な特徴）	128	64	200MB以上	詳細なオリジナルキャラ・多衣装対応

Rankは必ず2のべき乗を使ってください： 4, 8, 16, 32, 48, 64, 128。奇数値やそれ以外の値は学習が不安定になるケースがあります。また、Rankを高くしても品質が自動的に上がるわけではありません。データセットが小さい場合に高Rankを使うと、むしろ過学習が悪化します。

Illustrious XL 特有の注意点

Illustrious XL 専用設定

Network Alpha12025年以降の強い推奨（Civitai公式ガイド）

Clip Skip2Illustrious系は2が推奨（他のSDXLと異なる）

Caption方式Danbooru形式タグIllustrious XLはDanbooruデータで学習済み

UNET LR3e-4特に強いキャラ特徴学習に

TE LR3e-5UNET:TE = 10:1比率を維持

Max Steps1500〜2000Illustrious系は収束が早い

Resolution1024×1024最大1536×1536対応だが1024で十分

rsLoRA (Rank-Stabilized LoRA) について： 高Rank（64以上）を使う場合、rsLoRAを有効にすることで学習の安定性が向上します。kohya_ssでは "use_rslora" オプションをONにするだけで使えます。学習率のスケーリングが自動調整され、高Rankでの過学習リスクが低減します。

Rankとファイルサイズの関係

LoRAファイルサイズは主にRankに比例します。配布・販売を考える場合、Rank32（約70MB）がサイズと品質のバランスが最も良い選択肢です。

Rank 8 ≈ 15MB（軽量配布向け） Rank 32 ≈ 70MB（汎用バランス型） Rank 64 ≈ 120MB（高品質版） Rank 128 ≈ 200MB+（プロ用途）

5

ComfyUIでのLoRA重ね掛け・weight調整のコツ

基本：strength_model と strength_clip の違い

strength_model（UNet強度）

画像生成プロセス（拡散）への影響
視覚的な外見・スタイルに直結
高すぎると崩壊・アーティファクト発生
デフォルト：1.0

strength_clip（テキストエンコーダー強度）

プロンプトの解釈への影響
高すぎるとプロンプトが無効化される
トラブル時はCLIPを先に下げる
デフォルト：1.0

鉄則：LoRAが強すぎる場合はstrength_clipを先に下げてください。 strength_modelを下げる前にCLIPを0.7→0.5と段階的に試すと、プロンプト制御を維持したままキャラ特徴の強さを調整できます。

推奨LoRA重ね掛け構成（最大3枚）

Load Checkpoint

→

Load LoRA
スタイル 0.6/0.6

→

Load LoRA
キャラ 0.9/0.7

→

Load LoRA
小物/背景 0.4/0.4

→

CLIP Encode
KSampler → VAE

用途別推奨重みテーブル

LoRAタイプ	strength_model	strength_clip	使用優先度
キャラクターLoRA（主役）	0.7〜1.1	0.5〜0.9	最優先（他を削っても維持）
スタイルLoRA	0.4〜0.8	0.3〜0.7	キャラより低め
オブジェクト・小物	0.2〜0.6	0.2〜0.6	軽くかける程度
ライティング・色調	0.3〜0.7	0.2〜0.5	控えめが効果的
背景・環境	0.4〜0.6	0.3〜0.5	中程度

競合問題と解決法

症状	原因	解決策
キャラクターの顔・特徴が消える	スタイルLoRAが強すぎ	スタイルのstrength_clipを0.3〜0.5に下げる
テクスチャが崩壊・ハロー発生	複数スタイルLoRAが干渉	両方を0.3〜0.4に抑える・どちらか削除
オブジェクトが全体に広がる	オブジェクトLoRAが強すぎ	0.2〜0.3に下げてプロンプト強調も見直す
出力がぼんやり・泥状	LoRAが多すぎ	2〜3枚以内に絞る・全体を0.3〜0.7帯に収める
プロンプトが全く効かない	CLIPが強すぎ（合計値が高い）	全LoRAのstrength_clipを0.5以下に統一

高度な活用：LoRA Stacker ノード

複数LoRAを効率管理するなら efficiency-nodes-comfyui の「LoRA Stacker」ノードが便利です。

効率的な検証手順：
1. まず各LoRAを単体でテスト（シード固定）して特性を把握
2. キャラLoRAのみで良い結果を確認してからスタイルLoRAを追加
3. シードと設定を固定してweightを1つずつ変えてA/Bテスト
4. 成功した設定はワークフロー名とweight値をメモ保存

LoRA重みのネガティブ値活用

strength_modelにマイナス値（例：-0.5）を設定すると「逆方向」に学習内容を適用できます。特定のスタイルを意図的に回避したい場合や、ベースモデルの癖を打ち消したい場合に有効です。ただし実験的な使い方であり、予期しない結果になることもあります。

6

オリジナルキャラLoRAを作って同人販売する戦略

前提：なぜオリジナルキャラか

既存キャラのLoRa再現は権利侵害リスクが高い。 DLsite・FANZA・BOOTHいずれも「著作権者の許可ない既存キャラの模倣LoRA」は規約違反。アカウント停止・非公開化のリスクあり。2025年以降、各プラットフォームは審査を大幅強化済み。
→ オリジナルキャラLoRAで法的リスクゼロ・差別化できるブランドを構築するのが最も持続可能な戦略。

戦略ロードマップ（3ステップ）

Phase 1（1〜2ヶ月）：キャラクター設計とLoRA制作
ビジュアル設定（髪型・目・衣装・カラーパレット）を固定 → 20〜40枚のリファレンス画像を生成 → Illustrious XL でLoRAトレーニング → 品質チェック（多様なポーズ・表情・シチュエーションで検証）
Phase 2（2〜3ヶ月）：CG集制作と出品準備
キャラLoRAを使って50〜100枚のCG画像を生成 → ストーリー/シチュエーション設計 → ZIP+メタデータ準備 → DLsite/FANZA/BOOTH 同時出品（AI利用申告必須）
Phase 3（継続）：シリーズ展開・LoRA販売
CG集の反応をもとにキャラ改良 → 続編CG集 → キャラLoRA自体の販売（Civitai / Booth） → ファンコミュニティ形成

プラットフォーム比較と選択戦略

プラットフォーム	手数料	AI作品制限	集客力	推奨作品タイプ
DLsite	35〜40%	1サークル月2作品	◎ 最強	エロ系・ゲーム系
FANZA	35〜45%	月3作品	◎ 強力（DMM広告）	成人向けCG・フォト系
BOOTH	5.6% + 45円/件	模倣・大量出品に厳格対応	△ 自力集客必須	LoRAファイル販売・グッズ
Civitai	なし（Buzz制）	なし（コミュニティ規約のみ）	○ AI生成者コミュニティ	LoRAモデル・スタイル共有

推奨マルチプラットフォーム戦略

CG集（成人向け）： DLsite ＋ FANZA の両方に同時出品。手数料は高いが集客力で補填。
LoRAファイル販売： BOOTH（低手数料・直販）＋ Civitai（無料公開でブランド認知→有料版BOOTHへ誘導）。
全プラットフォームで「AI生成申告」を必ず実施。 非申告発覚時はアカウント停止リスクあり。

CG集の品質戦略（売れるものと売れないものの差）

売れるCG集の特徴

キャラクターの個性が明確（名前・設定・バックストーリー）
50枚以上（差分含め100〜200枚が理想）
ストーリー性・シチュエーション展開
高解像度（1024×1024以上、2048対応推奨）
表紙イラストのクオリティが高い
ニッチジャンルで差別化

売れないCG集の特徴

キャラクターに個性がない（汎用的な見た目）
枚数が少ない（20〜30枚以下）
単調なポーズ・背景の繰り返し
タイトル・説明文が貧弱
検索タグが不適切
AI感丸出しで修正なし

LoRAファイル自体の販売戦略

LoRAそのものを商品として販売する新しい収益モデルです。

LoRA販売価格設定ガイド

無料版（Civitai）認知獲得・ファン獲得限定機能・低rankバージョン

入門版（BOOTH）¥300〜¥500基本キャラLoRA 1種

標準版¥800〜¥1,500キャラ+衣装バリエーション

プレミアム版¥2,000〜¥3,000複数衣装+プロンプトガイド付き

フルパック¥5,000〜全衣装LoRA+スタイルLoRA+ガイド

収益シミュレーション（現実的な見通し）

フェーズ	期間	主な活動	月収見込み
スタート期	1〜3ヶ月目	初作品出品・SNS告知開始	¥0〜¥5,000
認知期	4〜6ヶ月目	シリーズ続編・LoRA販売開始	¥5,000〜¥30,000
成長期	7〜12ヶ月目	ファンコミュニティ・安定したシリーズ	¥30,000〜¥100,000
確立期	1年以降	ブランド確立・複数キャラ展開	¥100,000〜

        現実：AI同人の55%は週10部未満。月収¥10万超は継続6ヶ月以上かつSNS集客が必須条件。初月は¥0〜¥数千円を現実的な目標として設定し、品質向上と継続更新で積み上げる戦略が最も成功率が高い。
      

SNSマーケティング戦略

X（Twitter）： LoRA生成画像を毎日1〜3枚投稿。#AI生成 #AIイラスト #ComfyUI などのハッシュタグ必須。プロセス動画（BeforeAfter）は特に伸びやすい
Civitai無料公開： 無料版を配布してフォロワー獲得。ページに有料版BOOTHへのリンクを必ず掲載
pixiv： AI申告あり作品として投稿。ファンアート的な反応を得やすい（オリジナルキャラに絞ること）
Fantia / Patreon： 月額サブスク化。未公開バリエーション・制作過程・LoRAファイルの先行提供で差別化
キャラ固定の一貫性： 同じキャラを繰り返し投稿することでフォロワーが「このキャラが好き」になる。LoRAの一貫性が最大の武器

+

付録：RTX3090環境での実践チェックリスト

kohya_ss SDXL/Illustrious LoRA トレーニング完全チェックリスト

項目	設定値	確認
ベースモデル	Illustrious-XL-v2.0.safetensors	□
解像度	1024×1024 + Enable Buckets ON	□
Network Rank	32〜64（キャラ複雑さに応じて）	□
Network Alpha	1 または DIM/2	□
UNET LR	1e-4 〜 3e-4	□
Text Encoder LR	1e-5 〜 3e-5	□
Scheduler	cosine_with_restarts	□
Optimizer	AdamW8bit	□
Mixed Precision	bf16	□
Clip Skip	2（Illustrious系の場合）	□
Min SNR Gamma	5	□
Shuffle Captions	ON / Keep Tokens=1	□
Flip Augmentation	非対称キャラはOFF	□
Save Every N Steps	500〜1000	□
Max Train Steps	1500〜3000	□
データセット枚数	20〜40枚（品質優先）	□
キャプション方式	WD14タグ + 手動修正	□
フォルダ構成	XX_triggername/image.png + image.txt	□

DRスコア：100点 / 100点

目次

教師データの枚数・品質・前処理方法

必要枚数の目安

画像品質の基準

✓ 使うべき画像

✗ 避けるべき画像

前処理ステップ（推奨フロー）

② アップスケール

③ クロッピング

④ キャプション付け（最重要）

⑤ フォルダ構成

kohya_ss / SimpleTuner / OneTrainer 比較と最適設定

ツール比較表

kohya_ss 推奨設定（SDXL/Illustrious用）

学習ステップの確認ポイント

キャラクターLoRA vs スタイルLoRA：設定の違い

根本的な違い

キャプション戦略の違い（重要）

SDXL / Illustrious系モデル用LoRAの最適 Rank / Alpha 設定

Rank（DIM）とAlphaの基本理解

SDXL / Illustrious XL 推奨設定チャート

Illustrious XL 特有の注意点

Rankとファイルサイズの関係

ComfyUIでのLoRA重ね掛け・weight調整のコツ

基本：strength_model と strength_clip の違い

strength_model（UNet強度）

strength_clip（テキストエンコーダー強度）

推奨LoRA重ね掛け構成（最大3枚）

用途別 推奨重みテーブル

競合問題と解決法

高度な活用：LoRA Stacker ノード

LoRA重みのネガティブ値活用

オリジナルキャラLoRAを作って同人販売する戦略

前提：なぜオリジナルキャラか

戦略ロードマップ（3ステップ）

プラットフォーム比較と選択戦略

CG集の品質戦略（売れるものと売れないものの差）

売れるCG集の特徴

売れないCG集の特徴

LoRAファイル自体の販売戦略

収益シミュレーション（現実的な見通し）

SNSマーケティング戦略

付録：RTX3090環境での実践チェックリスト

kohya_ss SDXL/Illustrious LoRA トレーニング 完全チェックリスト

参考文献・ソース

用途別推奨重みテーブル

kohya_ss SDXL/Illustrious LoRA トレーニング完全チェックリスト