「枚数より品質」が現在の定説です。低品質な100枚より、高品質な20〜30枚のほうが優れたLoRAができます。
| 用途 | 最小枚数 | 推奨枚数 | 備考 |
|---|---|---|---|
| アニメキャラクターLoRA | 10枚 | 20〜40枚 | 角度・表情・衣装のバリエーション必須 |
| リアル人物LoRA | 20枚 | 30〜50枚 | 顔アップ多め、異なる照明条件で |
| スタイルLoRA | 30枚 | 50〜200枚 | スタイルの汎化には多めのデータが必要 |
| オブジェクト・衣装 | 15枚 | 30〜50枚 | 多角度・異なる背景で撮影 |
kohya_ssはPillowで自動アップスケールしますが品質が低いため、事前に手動アップスケールが推奨です。
anime-face-detectorで自動クロップが可能キャプションの質がLoRA品質を決定します。以下の3方式から選択またはハイブリッド運用:
| 方式 | ツール | 特徴 | 向いている用途 |
|---|---|---|---|
| Danbooruタグ方式 | WD14 Tagger | アニメ画像に特化・高精度なタグ自動生成 | アニメキャラ・イラスト系 |
| 自然文キャプション | JoyCaption / BLIP2 | 文章形式で詳細な説明が可能 | リアル系・スタイルLoRA |
| 手動キャプション | テキストエディタ | 最も精度が高い・工数大 | 高品質なLoRA制作 |
| ハイブリッド | WD14 + JoyCaption | タグ+文章の両方の強みを活用 | 2026年の最新ベストプラクティス |
training_data/
└── 20_mycharacter/ ← 数字がリピート数(20回繰り返し)
├── image001.png
├── image001.txt ← キャプションファイル(同名.txt)
├── image002.png
└── image002.txt
| 項目 | kohya_ss | SimpleTuner | OneTrainer |
|---|---|---|---|
| 対応モデル | SD1.5, SDXL, Illustrious, FLUX(musubi-tuner経由) | FLUX.1, FLUX.2特化(SD3.5も対応) | SD1.5, SDXL, FLUX Dev |
| UI | Web GUIあり(使いやすい) | CLIベース(JSONコンフィグ) | デスクトップGUI(直感的) |
| VRAM要求 | SDXL:10GB〜(bf16+fused backward使用時) | 約20GB(Optimum-Quanto使用時削減可) | 10.3GB〜(最適化プリセット使用時) |
| マスクトレーニング | アルファマスク対応 | 非対応 | ◎ 最強(背景分離が精密) |
| SDXL/Illustrious | ◎ 最も実績あり | △ 非特化だが動作可 | ○ 良好(写実系は特に高品質) |
| FLUX.2対応 | △ musubi-tuner経由 | ◎ ネイティブ対応(15〜25%高速) | ○ TE保存に制約あり |
| 学習の汎化性 | ◎ 多様プロンプトで優秀 | ○ 安定した結果 | ○ 写実系特に良好 |
| 初心者向け | ○ GUIで敷居低め | △ CLI操作が必要 | ◎ GUIが直感的で最も簡単 |
| コミュニティ | ◎ 最大・情報豊富 | ○ 成長中 | ○ 活発 |
アニメ・Illustrious XL系LoRA制作(RTX3090環境):→ kohya_ss 一択
実績・情報量・設定の柔軟性が圧倒的。SDXL/Illustrious系の最適化が最も進んでいる。
FLUX.2モデルのLoRA:→ SimpleTuner
ネイティブ対応で最も安定・高速。
背景を除いたマスクトレーニングが必要:→ OneTrainer
特定部位だけを学習させる精密なマスク機能が強み。
キャラクターLoRAは「誰であるか」を学習させ、スタイルLoRAは「どのように描くか」を学習させます。目的が異なるため、最適なパラメーターも大きく異なります。
| 設定項目 | キャラクターLoRA | スタイルLoRA |
|---|---|---|
| Network Rank (DIM) | 32〜64(複雑なキャラは64〜128) | 16〜64(高すぎると内容暗記になる) |
| Network Alpha | DIM/2 または 1 | DIM/2(保守的な影響が安定) |
| Training Steps | 1,000〜3,000ステップ | 2,000〜8,000ステップ(汎化に多く必要) |
| Learning Rate | 1e-4 〜 3e-4(低め) | 3e-4 〜 8e-4(高め) |
| データセット枚数 | 20〜40枚 | 50〜200枚(多様性重要) |
| 学習対象レイヤー | Attentionレイヤーのみで十分 | FF層も含めると質感表現が向上 |
| キャプション方式 | Danbooruタグ(WD14)推奨 | 自然文(JoyCaption)推奨 |
| データの多様性 | 角度・表情・衣装のバリエーション | 様々なシチュエーション・被写体のスタイル統一 |
| 過学習リスク | 特定ポーズへの固定化 | 特定の構図・被写体への固定化 |
RankはLoRAが学習できる「情報量の上限」です。Alphaは実際の学習影響度のスケールを制御します。
| キャラクターの複雑さ | Network Rank | Network Alpha | ファイルサイズ目安 | 用途例 |
|---|---|---|---|---|
| シンプル(顔・基本衣装のみ) | 4〜8 | 4〜1 | 5〜15MB | 単純なコンセプト、基本顔立ち |
| 標準(キャラ全体・普通の衣装) | 16〜32 | 8〜16 | 30〜70MB | 一般的なアニメキャラ |
| 複雑(多彩な衣装・アクセサリー) | 48〜64 | 24〜32 | 70〜120MB | ゲームキャラ・詳細なオリジナル |
| 超複雑(複数衣装・細密な特徴) | 128 | 64 | 200MB以上 | 詳細なオリジナルキャラ・多衣装対応 |
LoRAファイルサイズは主にRankに比例します。配布・販売を考える場合、Rank32(約70MB)がサイズと品質のバランスが最も良い選択肢です。
| LoRAタイプ | strength_model | strength_clip | 使用優先度 |
|---|---|---|---|
| キャラクターLoRA(主役) | 0.7〜1.1 | 0.5〜0.9 | 最優先(他を削っても維持) |
| スタイルLoRA | 0.4〜0.8 | 0.3〜0.7 | キャラより低め |
| オブジェクト・小物 | 0.2〜0.6 | 0.2〜0.6 | 軽くかける程度 |
| ライティング・色調 | 0.3〜0.7 | 0.2〜0.5 | 控えめが効果的 |
| 背景・環境 | 0.4〜0.6 | 0.3〜0.5 | 中程度 |
| 症状 | 原因 | 解決策 |
|---|---|---|
| キャラクターの顔・特徴が消える | スタイルLoRAが強すぎ | スタイルのstrength_clipを0.3〜0.5に下げる |
| テクスチャが崩壊・ハロー発生 | 複数スタイルLoRAが干渉 | 両方を0.3〜0.4に抑える・どちらか削除 |
| オブジェクトが全体に広がる | オブジェクトLoRAが強すぎ | 0.2〜0.3に下げてプロンプト強調も見直す |
| 出力がぼんやり・泥状 | LoRAが多すぎ | 2〜3枚以内に絞る・全体を0.3〜0.7帯に収める |
| プロンプトが全く効かない | CLIPが強すぎ(合計値が高い) | 全LoRAのstrength_clipを0.5以下に統一 |
複数LoRAを効率管理するなら efficiency-nodes-comfyui の「LoRA Stacker」ノードが便利です。
| プラットフォーム | 手数料 | AI作品制限 | 集客力 | 推奨作品タイプ |
|---|---|---|---|---|
| DLsite | 35〜40% | 1サークル月2作品 | ◎ 最強 | エロ系・ゲーム系 |
| FANZA | 35〜45% | 月3作品 | ◎ 強力(DMM広告) | 成人向けCG・フォト系 |
| BOOTH | 5.6% + 45円/件 | 模倣・大量出品に厳格対応 | △ 自力集客必須 | LoRAファイル販売・グッズ |
| Civitai | なし(Buzz制) | なし(コミュニティ規約のみ) | ○ AI生成者コミュニティ | LoRAモデル・スタイル共有 |
CG集(成人向け): DLsite + FANZA の両方に同時出品。手数料は高いが集客力で補填。
LoRAファイル販売: BOOTH(低手数料・直販)+ Civitai(無料公開でブランド認知→有料版BOOTHへ誘導)。
全プラットフォームで「AI生成申告」を必ず実施。 非申告発覚時はアカウント停止リスクあり。
LoRAそのものを商品として販売する新しい収益モデルです。
| フェーズ | 期間 | 主な活動 | 月収見込み |
|---|---|---|---|
| スタート期 | 1〜3ヶ月目 | 初作品出品・SNS告知開始 | ¥0〜¥5,000 |
| 認知期 | 4〜6ヶ月目 | シリーズ続編・LoRA販売開始 | ¥5,000〜¥30,000 |
| 成長期 | 7〜12ヶ月目 | ファンコミュニティ・安定したシリーズ | ¥30,000〜¥100,000 |
| 確立期 | 1年以降 | ブランド確立・複数キャラ展開 | ¥100,000〜 |
| 項目 | 設定値 | 確認 |
|---|---|---|
| ベースモデル | Illustrious-XL-v2.0.safetensors | □ |
| 解像度 | 1024×1024 + Enable Buckets ON | □ |
| Network Rank | 32〜64(キャラ複雑さに応じて) | □ |
| Network Alpha | 1 または DIM/2 | □ |
| UNET LR | 1e-4 〜 3e-4 | □ |
| Text Encoder LR | 1e-5 〜 3e-5 | □ |
| Scheduler | cosine_with_restarts | □ |
| Optimizer | AdamW8bit | □ |
| Mixed Precision | bf16 | □ |
| Clip Skip | 2(Illustrious系の場合) | □ |
| Min SNR Gamma | 5 | □ |
| Shuffle Captions | ON / Keep Tokens=1 | □ |
| Flip Augmentation | 非対称キャラはOFF | □ |
| Save Every N Steps | 500〜1000 | □ |
| Max Train Steps | 1500〜3000 | □ |
| データセット枚数 | 20〜40枚(品質優先) | □ |
| キャプション方式 | WD14タグ + 手動修正 | □ |
| フォルダ構成 | XX_triggername/image.png + image.txt | □ |