DEEP RESEARCH
超実践・手取り足取り
非エンジニア向け
本人で作る「オリジナルキャラLoRA」最短手順RTX 3090 Ti / SDXL / kohya_ss 前提
このPCに既にある資産(RTX 3090 Ti 24GB・A1111/ComfyUI・waiIllustrious 等 SDXL モデル)だけで、コードを書かずに自分のキャラのLoRAを作り切るための実践ガイド。技術論より「手の動かし方」に全振り。
発行日:2026-06-15 / 対象:自分でLoRAを1本も作ったことがない本人 / 想定ゴール:30日で再現性のあるキャラLoRA 1本
数値(dim/alpha/lr/step 等)は複数ソース一致の「目安」 として提示。環境差で最適値は動くため、必ず手元のsmokeで検証してください(断定値ではありません)。
1 結論 2 LoRAとは 3 素材集め 4 ツール導入
5 推奨設定 6 回し方 7 A1111で使う 8 失敗対処
9 撤退ライン 10 落とし穴 11 既存資産/関連DR 12 脚注
1
結論:最短ルートは「VRoid or 既存モデルで素材30枚 → kohya_ss GUI → dim16 / lr1e-4 / 約1500step」
非エンジニアの本人が最短でブレないキャラLoRAを作るための「迷わない既定値」はこれです。すべて後段で根拠と手順を示します。
20–40枚同一キャラ学習素材(目安)[3][9]
dim 16–32alpha=dim もしくは dim/2[1][2]
1e-4SDXL 学習率のベースライン[1][5]
1000–3000総ステップ(キャラ用 目安)[5]
<lora:名前:0.8>A1111での呼び出し[6]
このPCの強み: RTX 3090 Ti 24GB はSDXL LoRA学習で最も快適な帯(batch 2-4 が回る 16–24GB 帯[1] )。クラウド課金やVRAM不足の工夫が要らない=学習設定で悩む要素が1つ減る。
🤑 マネタイザー LoRA 1本=あなた専用のキャラ量産装置。1本作れれば同じ顔で何百枚でも出せる。最初の1本の固定費(時間)を払えば、以降の限界費用はほぼゼロ。まず「動く1本」を持て。
💼 コーチ 完璧な設定を探す前に、まず既定値で1本回し切る。失敗してもPC的リスクはゼロ。1サイクル=最短2–3時間。今日の夜に1本回せます。
💕 メンター 「コードが書けないから無理」は思い込みです。今のkohya_ssは全部GUIのボタン操作。怖いのは最初の1回だけ。一緒に手順をなぞりましょう。
LoRA(Low-Rank Adaptation)は、巨大な絵のAI(SDXL本体)を丸ごと作り直さず、「あなたのキャラの特徴だけ」を覚えた小さな追加ファイル です。本体に後付けする“眼鏡”や“フィルター”のイメージ。
本体モデル(例 waiIllustrious) 「アニメ絵全般」を知っている巨大ファイル(数GB)。ここはいじらない。
LoRA(あなたが作る) 「この髪・この目・この顔・この服」だけを覚えた小ファイル(数MB〜十数MB、dim依存[1] )。本体に重ねて使う。
なぜLoRAなのか(応急策との違い)
seed固定・タグ盛り・参照系(IPAdapter等)の応急策は手軽ですが、シーンや構図が変わると顔が崩れやすい。LoRAはキャラの同一性をモデル側に焼き込む ため、構図・表情・服が変わっても顔が保たれます。「同じ顔で何枚も・何ジャンルも」を狙うならLoRAが本命。
3種類を混同しない: ①LoRA(追加学習ファイル=本DRの主役)②本体モデル(SDXL/waiIllustrious 等)③拡張機能(A1111のタブ機能)。LoRAはモデルではなく“モデルへの追記”です。
3
学習素材の集め方(同一キャラ20〜40枚をSDで用意するコツ)
LoRAの出来は9割が素材 で決まります。「枚数より一貫性」。25枚の良い素材は75枚のバラついた素材に勝ります[3] 。
枚数と解像度の目安
項目 目安 根拠
総枚数 20〜40枚(最低10〜50[9] )。まず30枚で固定[3] 複数ソース一致
解像度 1024×1024(SDXL)。大きく撮って縮小[3][9] SDXL標準
内訳 全身・上半身・顔アップ・正面/斜め/横/後ろを混ぜる[9] 角度の多様性
背景 多少バラけてよい(むしろ汎用性UP)[3] 過学習回避
素材を“同一キャラ”で揃える3ルート
ルートA:VRoid Studio 無料の3Dキャラ作成ソフトで1体作り、Photo Boothで全角度を撮影(2048で撮り1024へ縮小)[9] 。最も一貫性が高い
ルートB:既存SDXLで生成 このPCのwaiIllustrious等で、固定seed+固定タグ+少量i2i/inpaintで同一顔を量産→選別。選別が命
ルートC:手描き/手持ち 自分の絵やラフを清書。最も“オリジナル性”が高いが枚数を揃えにくい。
ルートBの実務(このPC向け): 本体に waiIllustrious をロード→キャラ特徴タグ(髪色/髪型/目色/輪郭/服)を固定→seed固定で表情・角度だけ振る→顔・髪色・目色がブレた1枚は容赦なく捨てる 。MEMORYの色化け教訓どおり、髪色/目色は化けやすい最大の弱点なので素材段階で潰す。
キャプション(.txt)の付け方
kohya学習では各画像に同名の .txt が必要[3] 。手書きは不要、A1111拡張で自動化できます。
A1111に stable-diffusion-webui-wd14-tagger を入れる[9]
Batch directory モードで画像フォルダを指定→Interrogate で全画像にタグ自動生成[9]
「Additional tags」に固有トリガー語 (例:mychar_aoi )と class(例:1girl )を先頭付与[9]
dataset-tag-editor で重複・不要タグを掃除[9]
トリガー語のコツ: 覚えさせたい特徴(髪色など)はキャプションからあえて消す とトリガー語に吸収されやすい。逆に「毎回変えたい服・背景」はタグに残す。これが“顔は固定・服は自由”を作る分岐点。
4
学習ツール(kohya_ss GUI)導入の概要
非エンジニアの本命は kohya_ss GUI 。kohyaの学習スクリプトをブラウザ画面のボタン操作だけで回せるラッパーです[4][8] 。
必要なもの(前提)
Python / Git / CUDA / C++ build tools[8] (多くはワンクリックインストーラ手順内で導入)
このPCは既にA1111/ComfyUIが動いている=GPUドライバ・CUDA環境は実績あり。土台はクリア済み。
導入の流れ(GUI)
専用フォルダを作る(例 D:\kohya_ss )[7]
kohya_ss GUI リポジトリを取得(git clone もしくは配布zip)[7]
フォルダ内の setup.bat をダブルクリック→メニュー1番(インストール)→torchを選ぶ→待つ[7]
gui.bat を実行→ http://127.0.0.1:7860 がブラウザで開く[7]
このPCならではの注意(MEMORY反映): kohya学習中はComfyUIをVRAM常駐させない/別GPUタスクと並走させない。過去にcomfy併走でVRAM奪い合い→学習が17倍遅くなった実績あり。学習前に他のGPUプロセス(旧factory・comfy)を落とす。
バージョン差でGUIのタブ名・項目位置は変わります。本DRは「どの値をどう入れるか」を示すので、画面上のラベルが一致しなくても“同じ意味の欄”を探してください。
5
推奨設定(SDXLキャラLoRA・複数ソース一致の目安)
⚠ 以下はすべて「複数ソース一致の目安値」 であり断定ではありません。最適値は素材・キャラ・本体モデルで変動します。必ず途中チェックポイントで実画像を見て調整してください。
項目 目安値 意味・効き方 根拠
Network Rank (dim) 16〜32 覚える容量。キャラ似せは16-32帯[1] 。大きいほどファイル大・過学習寄り [1][2]
Network Alpha dim と同じ or dim/2 同値=安定、半分=学習を強める[1] [1][2]
Learning rate 1e-4(0.0001) SDXLの標準ベースライン[1][5] 。崩れるなら下げる [1][5]
UNet / TE LR 例 3e-5 を個別指定する流派も[1] テキストエンコーダを弱めると過学習しにくい [1]
総ステップ 1000〜3000(キャラ)[5] step = epoch × (枚数 ÷ batch)[5] [5]
Epoch 10前後から[5] 30枚×50epoch÷batch1=1500step の例[5] [5]
Optimizer AdamW8bit VRAM節約の定番[1] 。3090Tiなら余裕 [1]
Gradient checkpointing ON VRAM削減[1] [1]
Min SNR gamma 5 学習安定の補助[1] [1]
Caption dropout 0.05 汎用性を上げる[1] [1]
解像度 1024×1024 SDXL前提[3] [3]
Save every N steps 200〜500ごと[5] 途中版を残して当たりを選ぶ(重要) [5]
本DRの「迷わない初回セット」: dim16 / alpha16 / lr1e-4 / batch2 / 30枚 / 10epoch(≒1500step)/ 256〜512stepごと保存。これで1本回し、保存版を見比べて当たりを採用。3090Ti 24GBならbatch2-4が回る帯[1] 。
手順(GUI)
kohya_ss GUI →「LoRA」タブ→「Training」
本体モデル(waiIllustrious 等のSDXL .safetensors)を Model に指定
画像フォルダ(.txt付き)を指定。kohya式フォルダ名 N_トリガー語 class (例 10_mychar_aoi 1girl )でrepeat回数を表現
セクション5の値を入力→Save every N steps を設定
「Start training」→ターミナルにstep進行が出る
終わると .safetensors のLoRAが出力される
所要時間の目安(3090Ti級・SDXL・あくまで目安)
≈30–90分1500–2000step / batch2 の1本(環境依存)
速度は“実測”で: 進行ログのstep/秒(tqdmの平均は当てにならない)でstep差分から実測。極端に遅い(例 数十秒/step)ときはVRAM奪い合い=他GPUプロセスを疑う(MEMORY実績)。
出力された .safetensors を A1111 の stable-diffusion-webui\models\Lora\ に置く
A1111 を起動→生成画面の「Lora」タブで一覧から自分のLoRAをクリック(プロンプトに自動挿入)[6]
または直接プロンプトに記述:
masterpiece, 1girl, mychar_aoi, standing, school uniform <lora:mychar_aoi_v1:0.8>
呼び出し書式: <lora:ファイル名:強さ> (拡張子は書かない)[6]
強さ(multiplier): 0〜1。1が標準、0で無効[6] 。キャラLoRAは 0.7〜0.9 から調整が扱いやすい
トリガー語: 学習時に付けた固有語(例 mychar_aoi)をプロンプトに入れると発動しやすい
本体一致が必須: SDXLで学習したLoRAはSDXL本体でのみ動く(SD1.5本体では動かない)[6]
負プロンプト不可: LoRAタグはネガティブには入れられない[6]
強さの目安: 顔が他キャラに引っ張られる→強さを上げる/トリガー語を強調。塗り・構図まで素材コピーっぽくなる→強さを下げる(0.6前後)。ComfyUIでも同じLoRAを LoraLoader で使えます。
症状 原因の主候補 対処
毎回 顔・髪色・目色がブレる 素材の一貫性不足 素材段階で化けた枚を全削除→揃え直す(9割は素材問題)[3]
背景・服まで素材のコピーになる (=過学習) step過多 / dim過大 / TE強すぎ 早いepochの保存版を使う[5] /lrを下げる/dimを下げ alpha上げ/repeat減[8]
色が飽和・ノイズが増える 過学習サイン ログで飽和/ノイズ増を監視し、その手前のチェックポイントを採用[5][8]
似てこない(学習弱い/underfit) step不足 / 学習弱すぎ epoch増・lr上げ・alpha上げ。ただし上げすぎは過学習へ
使うと絵が崩れる 本体不一致 SDXL LoRAはSDXL本体で。強さを0.6前後へ[6]
最強の予防策=途中保存して見比べる: 200〜500stepごとに保存し、各版を同じプロンプト・同seedで生成して並べる[5] 。「似てる×崩れてない」の交点が当たり。過学習は“最後の版が一番良い”とは限らない。
R18運用のキャラ固定(MEMORY反映): このPCの実運用では strength 0.6では弱く 0.78 付近+髪色/目色の冗長固定+化けやすい他色を全NEG、で一貫性が出た実績。解像度は 1024×1536 が複製破綻しにくい安定域。新キャラは応急策でなく最初からLoRA先行が結論。
30日で1キャラ完成プラン
Day 1–3:環境 kohya_ss GUI 導入・gui.bat 起動確認・本体モデル配置。土台はA1111/ComfyUI実績ありで楽勝帯。
Day 4–10:素材 キャラ設定を1枚決める→ルートA/Bで30枚生成・選別→WD14でキャプション→トリガー語付与。ここに一番時間をかける 。
Day 11–14:初回学習 「迷わない初回セット」で1本回す→保存版を見比べ→当たりを暫定採用。
Day 15–21:調整 過学習/underfitを見てlr・step・dim・素材を1要素ずつ変えて3–5本。比較表で記録。
Day 22–27:実戦投入 A1111/ComfyUIで色々な構図・表情・服を生成→ブレないか実戦テスト→必要なら素材追加で再学習。
Day 28–30:確定 ベスト版を v1 として確定・命名・バックアップ。設定値を自分用テンプレ化(次キャラは数日で作れる体制へ)。
撤退ライン(深追いしない判断基準)
5本回しても 顔がブレ続ける → 学習設定でなく素材の一貫性 に戻る(設定いじりを止める)
素材も揃えた のに似ない → 本体モデルとの相性を疑い、別SDXL本体(Pony系/Illustrious系)で再学習
それでも 商用品質に届かない → 一旦LoRAを諦め、IPAdapter等の参照系+seed固定の応急運用に切替(別DR群参照)。完璧主義で日数を溶かさない。
設定探しの沼: 既定値で1本回す前から最適パラメータを探して何日も溶かす。→まず1本。
素材を雑に集める: 枚数だけ揃えてブレ素材を入れる。→9割は素材で決まる[3] 。
SD1.5とSDXLの取り違え: SDXLで学習したLoRAをSD1.5本体で使い崩れる[6] 。
過学習を“完成”と誤認: 素材コピー状態を「そっくり!」と喜ぶ。→構図/服が変えられないなら過学習[8] 。
最終版だけ使う: 途中保存を残さず一番良い版を取り逃す[5] 。
キャプションの作り込み不足: トリガー語を入れない/覚えさせたい特徴をタグに残し吸収されない。
GPU並走: 学習中にComfyUI等を回しVRAM奪い合い→激遅(MEMORY実績)。
タグの書式ミス: <lora:名前:0.8> のコロン抜け等で発動しない[6] 。
髪色/目色の化け放置: SDXLで最も化けやすい。素材・キャプション・NEGの三段で固定(MEMORY反映)。
記録しない: どの設定でどうだったかを残さず再現できない。→1行でも比較表に残す。
このPCの既存資産(そのまま使う)
GPU: RTX 3090 Ti 24GB = SDXL LoRA学習の最快帯(クラウド不要・batch2-4可[1] )
本体モデル: waiIllustriousSDXL_v160 ほか実績SDXL(素材生成にもLoRA運用にも流用)
A1111/ComfyUI: 素材生成・WD14タグ付け・出来たLoRAの運用に既に使える
運用ノウハウ: 髪色/目色の冗長固定・色NEG・1024×1536安定域・GPU並走回避(MEMORY蓄積)
関連DR(D:\市場調査資料\ 既存・重複回避済み)
本DRは「非エンジニア本人が最短で1本作る手取り足取り版 」に特化。以下は技術深掘り・量産・一貫性の専門DRで、読み進める順に並べました。
段階 関連DR(既存ファイル名)
本DRの次・実践手順 DR_キャラLoRA学習実践完全手順_2026-06-09.html
素材設計 DR_キャラLoRA学習データ40枚最適内訳2026_2026-06-01.html / DR_LoRA学習データスクリーニング自動化_2026-06-08.html
パラメータ最適化 DR_LoRA学習パラメータ最適化_2026-06-08.html / DR_lora_hyperparam_best_2026-06-02.html
全属性固定・一貫性 DR_キャラLoRA全属性固定_学習データ設計とタグ戦略_2026-06-11.html / DR_キャラLoRA量産一貫性の決定版_2026-06-11.html
少枚数・高速 DR_LoRA少枚数高精度学習法2026_2026-06-04.html / DR_lora_fastest_2026-06-06.html
失敗パターン DR_LoRA_キャラ学習失敗パターンと再現性チェックリスト2026_2026-06-02.html / DR_R18LoRA顔崩れ埴輪化防止_2026-06-01.html
使う/運用 DR_キャラLoRA活用完全ガイド_2026-06-08.html / DR_LoRAマージ統合テクニック_2026-06-08.html
LoRA無しの代替 DR_LoRA無し一貫性最大化_応急決定版_2026-05-30.html / DR_IPAdapter_LoRA_キャラ固定_2026-06-08.html
モデル選定 DR_SDXL_Illustrious_Pony_モデルLoRA選定運用ガイド_2026-06-09.html
🤑 マネタイザー 1本目で“作り方”を体に入れたら、2本目以降はテンプレ流用で数日。キャラが増える=商品ラインが増える。最初の1本は投資。
💼 コーチ 関連DRは“辞書”。最初から全部読まず、詰まった章だけ引く。本DRの順路どおり手を動かすのが最短。
💕 メンター もう道具は全部あなたの手元にあります。足りないのは「最初の1本を回す勇気」だけ。今夜、迷わない初回セットで回してみましょう。
数値は複数ソース一致の「目安」。環境差で最適値は変動するため断定していません。R18運用上の固定値(strength0.78・色NEG・1024×1536等)は本PCの実運用知見(一次)に基づきます。