自動化と品質を両立する"100点"運用の設計図
― 異変探し×エロCG集の出荷ゲート+継続改善 ―

同一ベース+透過レイヤー後乗せ方式 / 機械ゲート×4AIアンサンブル×トフィーさん実機判定
テーマ: 100点定義と出荷ゲート運用 目標: 100点級 重視軸: 技術(実装直結) 作成日: 2026-06-13
本DRの位置づけ ― 既存資産(出荷ゲート140点中85・品質ゲート9軸・4AI評価)を「1本の運用ループ」として束ね直し、自動化率を上げつつ100点品質を担保する設計図。 下書きエンジン=grok-4.3(grok_router.py経由 / kind=dr_standard / 推定¥85)。1次情報16ソース(脚注)。 重要前提: 本書のしきい値・点数は全て初期値=要キャリブレーションであり、最終的な合否・「売れる/売れない」の判定はトフィーさんの実機判定を最上位とする(AIスコアは目安)。一次未確認は「要確認」と明示。
1. 結論 ― 100点運用の核 2. 市場規模 ― なぜ"出荷ゲート"が金になるか 3. 競合TOP10 ― 採点の物差し(参照基準) 4. 技術スタック ― 9軸100点定義と自動/人手割合 5. 収益試算 = しきい値設計(三層ゲート) 6. リスク = AI採点のブレと補正設計 7. 30日プラン ― 自動化ループ構築 8. 撤退ライン = Killスイッチ即没条件 9. 落とし穴 ― 96点止まりの真因 10. 既存資産活用 ― CC3/4AIへの接続 11. 関連DR一覧 12. 脚注(全URL)

1結論 ― 100点運用の核

設計図:機械で"致命"を全消し → 4AI中央値で"感性" → 人間が"見せ場・面白さ・最終GO"

"100点"は単一スコアではなく9軸の合成+致命ゼロ条件で定義する。自動化の要諦は「機械で弾けるものは1枚残らず機械へ寄せ、人間の希少な判断力を可愛さ・異変の面白さ・最終GOの3点だけに集中させる」こと。これにより人手介入を全工程の3〜4割以下に圧縮しつつ品質を担保する。

2市場規模 ― なぜ"出荷ゲート"が金になるか

「100点運用=出荷ゲート」を持つことの価値は、量産しても品質が下振れしない点にある。AI生成同人の最大の弱点は「枚数は出るが当たり外れが大きい」こと。ゲートは"外れ"を出荷前に機械で間引き、人間の目を当たり候補だけに向ける装置である。これは製造業のAQL(抜取検査)/ゼロディフェクト思想と同型で、「1枚の不良流出コスト(評価低下・規約抵触)が、全数自動検査コストを上回る」領域では全数機械検査が合理[11]。CG集は枚数が有限(数十枚)なので全数機械ゲート+抜取人間確認が現実解。

9軸
100点の多軸定義
2段
決定論→4AI合議
3層
致命0/出荷可/トフィー基準
~3-4割
人手介入の上限目安
事業的な意味: このゲート資産は本シリーズだけでなく、後続の異変探しシリーズ(終電/ラブホ/学校…)全Volに横展開できる「品質の定規」になる。定規が固定されれば、量産=定規に当てて落ちたものを直すだけの作業に単純化される。

3競合TOP10 ― 採点の物差し(参照基準)

"100点"を恣意でなく外部基準に接地するための参照ソース。AIへ与える正解像のリファレンスかつ、機械しきい値の根拠になる。

#基準ソース運用に効く要点出典
1品質ゲート(Quality Gate)の定義次工程へ進む前に満たすべき閾値を強制するチェックポイント。閾値は成熟度・リスク許容度で調整可[1]
2Definition of Done / 受入基準受入基準=各カット(ストーリー)の門、DoD=作品増分(Vol)の門。粒度を分離せよ[2]
3SonarQube型ゲート思想"New Code"(今回追加分)と全体を分離して評価=新規レイヤーだけ厳しく見る発想に転用可[3]
4LLM-as-a-judge 信頼性研究単体judgeはFleiss' κ≈0.3程度・順序/冗長/同調バイアス有。合議で改善するが系統バイアスは残る[5]
5Krippendorff's α(評価者間信頼性)α≥0.667で中程度・≥0.8で強い一致。4AIの一致度を測る指標として転用[6]
6Laplacian分散ブラー検出鮮明度=ラプラシアン分散。閾値はデータ依存で要チューニング(目安100前後)[7]
7ArcFaceコサイン類似度本人判定≧0.6/高品質≧0.5/動画一貫性≧0.7・最新生成は0.85前後。キャラ一貫の機械指標[8]
8拡散モデルの破綻アーティファクト研究手指・余分指・解剖破綻が代表的崩れ。2025以降は改善傾向だが要検出継続[9]
9FANZAモザイク基準(長辺1/100)長辺÷100がブロック最小サイズ・4px下限。要確認(公式倫理規定で最終確認)[10]
10AQL/ゼロディフェクト+PDCA抜取/全数の使い分け・Pareto/5Why/Fishboneで改善ループを回す型[11][12]

4技術スタック ― 9軸100点定義と自動/人手割合

配点は提案初期値(合計100)。同一ベース方式ゆえ異変の明確さ・キャラ一貫・崩れ無し・エロ強度に厚く配点する(=ここで読者が冷める)。各軸を「機械が測れる部分」と「人手/AIが測る部分」に割り振り、機械化率の目標を置く。割合は運用後に実測で再調整。

#配点機械(決定論)で測る人手/AIで測る機械化率目安
1背景一致10ベースとのピクセル差分/SSIM、レイヤー継ぎ目のエッジ不連続継ぎ目の"気持ち悪さ"最終確認~80%
2異変の明確さ・難易度15異変レイヤーの位置・面積・正常版との差分が存在するか分かる/理不尽でない/簡単すぎない(4AI+人間)~40%
3キャラ一貫15顔ArcFace類似度、髪色/目色のHSV帯一致、体型比小物(ストラップ等)・下着色・髪流れの揃い~70%
4崩れ無し15手指/余分人物/解剖破綻の検出、NSFW崩壊分類微妙な破綻の最終目視~75%
5エロ強度(萌え/抜け)15(補助のみ)露出領域・体液量の存在確認萌え/抜け/絶頂演出=4AI中央値+人間~20%
6モザイク適正10モザイク面積・ブロックサイズが長辺1/100下限以上か[10]過剰モザイクで萌え減の確認~85%
7写植可読5顔領域との重なり/はみ出し/禁則/文節改行[4]セリフの色気・棒読み感~85%
8構図10見せ場の画面占有率・三分割の重心視線誘導・見せ場の映え~35%
9没入(世界観連続性)5通路背景・ライト・カウンタ表示の固定性ループの中毒性・連続性体感~30%
設計の肝: ①④⑥⑦は機械化率70〜85%と高い=ここを機械に寄せきると人間の負荷が一気に減る。逆に⑤⑧⑨は本質的に感性=ここは4AI+人間に残す。「機械で測れる軸ほど厳しく自動足切り、感性軸ほど相対評価」が基本姿勢。

機械ゲートの具体ロジック(実装直結)

5収益試算 = しきい値設計(三層ゲート)

本シリーズの収益は「品質下振れの無いVolを安定供給できるか」に依存する。よって"試算"の代わりにしきい値設計を示す。既存の出荷ゲート(140点満点中85が合格)を、本9軸(100点系)+致命ゼロ条件に再マッピングした三層構造。

三層ゲート(初期値・要キャリブレーション)

条件(目安)判定
L0 致命ゼロKillスイッチ(§8)が1つも発火しない必須・1つでも発火→即リテイク
L1 出荷可機械ゲート総合 ≥ 88(致命ゼロ前提) かつ 4AI中央値 ≥ 90 かつ 軸別足切りを全通過出荷候補(人間最終GO待ち)
L2 トフィー基準機械・4AI中央値とも ≥ 96 かつ トフィーさん実機GO看板Vol・表紙級

軸別足切り(初期値)

総合点が高くても、没入を壊す軸が1つでも落ちると不合格にする。同一ベース方式で読者が冷める順=厳しめ4軸を設定。

足切り(目安)理由
背景一致≥ 8/10継ぎ目1つで"間違い探し"が成立せず没入崩壊
キャラ一貫≥ 12/15(ArcFace≥0.6)顔が別人化すると即バレ・即冷め
崩れ無し≥ 12/15手指破綻・余分人物はAI臭の代表
モザイク適正満点必須(規約)不足は販売停止リスク=妥協不可
140点満点との対応(既存資産接続): 既存「140中85」を本系に橋渡しするなら、140=9軸100点(技術)+40点(エロ/萌え魅力ボーナス)と解釈し、85≒「致命ゼロ+総合6割」=最低出荷ライン、本DRのL1(出荷可)はその上位ラインと位置づける。実際の換算係数は実機サンプルで較正する。※既存ゲートの内訳定義は実装ファイルで要確認

6リスク = AI採点のブレと補正設計

最大のリスクは「AI採点を信じすぎる」こと。研究上、LLM-as-a-judgeは単体でFleiss' κ≈0.3程度の一致しか出ず、順序バイアス・冗長/整形されたものを好むバイアス・自己同調バイアスが知られる[5]。合議(ジュリー)で安定性は改善するが、系統バイアスは完全には消えない。だからこそ機械ゲートとの二段が必須。

4AIアンサンブルの補正ルール(既存実機ベース)

絶対リスク(MEMORY既知): AIは数値・規約・「売れる/売れない」を自信満々に捏造する。本DRのしきい値・市場前提も二次情報は目安に過ぎない。一次情報(FANZA/DLsite公式規定)とトフィーさんの運用実機が出たら即上書きすること。DLsite AIフロアの作品数上限・FANZAモザイク基準は本DRでも「要確認」扱い[10][13]

730日プラン ― 自動化ループ構築

やること成果物
Week1
機械ゲート骨格
9軸の決定論チェックを1スクリプトに統合(ship_gate.py)。背景SSIM/ArcFace/手指/モザイク面積/写植IoUを実装。Kill条件をsys.exit(2)でブロック化機械ゲート単体・gate.json証跡出力
Week2
4AI接続&較正
既存_moe_nuke_4aiを中央値+α監視+BANガードで再整備。20〜30カットで機械点と4AI点の分布を取り初期しきい値を実測で確定較正済みしきい値表・分布グラフ
Week3
三層ゲート統合
L0/L1/L2を1パイプラインに。落ちたカットを軸別にPareto集計するダッシュボード化。人間GO用の抜取UI(候補のみ提示)出荷ゲート統合版+失敗Pareto表
Week4
改善ループ実証
1Vol分を通し、Pareto上位軸を5Why/Fishboneで工程特定→1工程だけ直して再採点。中央値の改善幅を記録し回し方を確定改善前後差レポート・運用Runbook
自動化の到達点: 30日後の理想は「生成→機械ゲート(全数)→落ちたものを自動でリテイク指示→通ったものだけ4AI→人間は候補リストの可愛さ・面白さ・最終GOだけ見る」。人間が画像を1枚ずつ全部見る運用から卒業する。

8撤退ライン = Killスイッチ即没条件

1つでも発火したら採点せず即リテイク(L0で弾く)。全て機械検出可能を原則とし、人間の目を使わせない。

即没Killスイッチ(機械検出)
  • モザイク不足: ブロック実寸 < 長辺1/100(最小4px) → 規約抵触で販売不可[10]
  • キャラ別人化: 顔ArcFace cosine < 0.5(基準カット比・初期値)[8]
  • 背景継ぎ目事故: 異変領域外の差分が閾値超(レイヤーズレ・別背景混入)
  • 余分人物/人数違反: 意図人数と検出人数が不一致(1girl作品に2人目混入)
  • 手指/解剖破綻: 指本数異常・溶け・余分肢を検出[9]
  • 写植が見せ場被り: 顔/性器bboxとテキストbboxのIoU>0
  • 髪色/目色の化け: 定義主色帯から外れる(金髪→黒/青等)
即没Killスイッチ(人間/AIガード)
  • 主人公が子供/ショタに見える: R18コンプラ最優先・絶対NG(MEMORY厳命)
  • 崩壊アヘ顔/白目/舌だらり: 可愛さを壊す=萌えも抜けもしない(可愛い絶頂顔へ差替)[16]
  • 立ち絵/日常コマに喘ぎ・絶頂SFX: 絵と音の不一致(実際のエロ行為コマのみ許可)

9落とし穴 ― 96点止まりの真因

10既存資産活用 ― CC3/4AIへの接続

本設計は新規構築でなく既存資産の束ね直し。接続点は以下。

既存資産役割本ゲートでの接続
品質ゲート9軸
(r18_quality_gate.html)
R18画像の9軸加重採点・Killスイッチ本9軸へ写経・加重を異変探し用に再配点(背景一致/異変軸を追加)
4AI評価
(_moe_nuke_4ai_2026-06-13.py)
grok43/grok420r/qwen-VLで萌え/抜け採点・BANガードL1の感性レイヤーへ。中央値+α監視を追加実装
出荷ゲート(140/85)最低出荷ラインL1の下限として較正接続(換算係数は実測)
CC3 TypesetGate
(_cc3_typeset_gate_2026-06-12.py・要存在確認)
写植の顔回避・禁則・配置検証軸⑦写植可読の機械判定として直結
LoRA一貫性4AI
(_cc1_4ai_eval_2026-06-11.py)
キャラ全属性固定の24項目チェック軸③キャラ一貫のembedding判定の上流QC
grok_router.py全Grok呼び出しの一元化・コストログ採点・改善提案の全LLM呼び出しを集約・grok_router_costs.jsonlに記録
次の一手(推奨): Week1でship_gate.pyを新規作成し、上記をimportで接続。出力はgate.json(各軸点・Kill理由・4AI中央値・α)をD:\projects\fanza3_mass\gates\へ証跡保存。量産ドライバのpreflight()が未合格をsys.exit(2)でブロックする既存パターンに合流させる。

11関連DR一覧

12脚注(全URL・実在ソース)

引用ソース

  1. What is a quality gate? — TechTarget: https://www.techtarget.com/searchsoftwarequality/definition/quality-gate
  2. How to compare acceptance criteria vs. definition of done — TechTarget: https://www.techtarget.com/searchsoftwarequality/tip/How-to-compare-acceptance-criteria-vs-definition-of-done
  3. What are quality gates in software development — Sonar: https://www.sonarsource.com/resources/library/quality-gate/
  4. Quality Gates in Testing: Framework, Metrics & Best Practices — testomat.io: https://testomat.io/blog/what-are-quality-gates-and-how-will-they-help-your-project/
  5. LLM-as-a-Judge: reliability & bias — Adaline: https://www.adaline.ai/blog/llm-as-a-judge-reliability-bias
  6. Krippendorff's Alpha for Annotation Agreement — Label Studio: https://labelstud.io/blog/how-to-use-krippendorff-s-alpha-to-measure-annotation-agreement/
  7. Blur detection with OpenCV (variance of Laplacian) — PyImageSearch: https://pyimagesearch.com/2015/09/07/blur-detection-with-opencv/
  8. A Gentle Introduction to Face-Sim (ArcFace cosine similarity) — Zenn: https://zenn.dev/taku_sid/articles/20250511_face_sim_metric?locale=en
  9. Characterizing Photorealism and Artifacts in Diffusion Model-Generated Images — arXiv: https://arxiv.org/html/2502.11989
  10. 【FANZA同人】モザイク修正について(長辺1/100基準・要公式確認) — note/miyochinAI: https://note.com/miyochinai/n/nb4af0981eb9d
  11. Zero-defect vs AQL inspection in precision manufacturing — PatSnap: https://www.patsnap.com/resources/blog/articles/zero-defect-vs-aql-inspection-in-precision-manufacturing/
  12. PDCA Problem Solving / Root Cause (Pareto・5Why・Fishbone) — agility-at-scale: https://agility-at-scale.com/safe/learning-culture/pdca-problem-solving/
  13. DLsiteに「AI生成フロア」が新設(作品数上限は要実機確認) — 窓の杜: https://forest.watch.impress.co.jp/docs/news/1569791.html
  14. 『8番出口』異変探しゲームのヒット要因・派生 — 4Gamer: https://www.4gamer.net/games/751/G075133/20241227008/
  15. Acceptable Quality Level (AQL) Ultimate Guide — SixSigma.us: https://www.6sigma.us/six-sigma-in-focus/acceptable-quality-level-aql/
  16. 実機方針(4AI=grok43/grok420r/qwen-VL・GPT-4o除外・可愛い絶頂顔/アヘ顔BANガード・トフィーさん実機最上位) — 制作チーム内部実装 D:\projects\_ero8_ref\_moe_nuke_4ai_2026-06-13.py および MEMORY.md(一次=運用実機)

※[10][13]は二次情報。販売規約・AIフロア上限・モザイク基準はFANZA/DLsite公式の最新倫理規定とトフィーさんの運用実機を最上位とし、相違があれば即上書きすること。本DRのしきい値・配点は全て初期値=要キャリブレーション。点数および「売れる/売れない」の最終判定はトフィーさんの実機判定が最上位。