自動化と品質を両立する"100点"運用の設計図
― 異変探し×エロCG集の出荷ゲート＋継続改善 ―

同一ベース＋透過レイヤー後乗せ方式 / 機械ゲート×4AIアンサンブル×トフィーさん実機判定

テーマ: 100点定義と出荷ゲート運用目標: 100点級重視軸: 技術(実装直結) 作成日: 2026-06-13

本DRの位置づけ ― 既存資産(出荷ゲート140点中85・品質ゲート9軸・4AI評価)を「1本の運用ループ」として束ね直し、自動化率を上げつつ100点品質を担保する設計図。下書きエンジン=grok-4.3(grok_router.py経由 / kind=dr_standard / 推定¥85)。1次情報16ソース(脚注)。 重要前提: 本書のしきい値・点数は全て初期値=要キャリブレーションであり、最終的な合否・「売れる/売れない」の判定はトフィーさんの実機判定を最上位とする(AIスコアは目安)。一次未確認は「要確認」と明示。

1. 結論 ― 100点運用の核 2. 市場規模 ― なぜ"出荷ゲート"が金になるか 3. 競合TOP10 ― 採点の物差し(参照基準) 4. 技術スタック ― 9軸100点定義と自動/人手割合 5. 収益試算＝しきい値設計(三層ゲート) 6. リスク＝ AI採点のブレと補正設計 7. 30日プラン ― 自動化ループ構築 8. 撤退ライン＝ Killスイッチ即没条件 9. 落とし穴 ― 96点止まりの真因 10. 既存資産活用 ― CC3/4AIへの接続 11. 関連DR一覧 12. 脚注(全URL)

1結論 ― 100点運用の核

設計図：機械で"致命"を全消し → 4AI中央値で"感性" → 人間が"見せ場・面白さ・最終GO"

"100点"は単一スコアではなく9軸の合成＋致命ゼロ条件で定義する。自動化の要諦は「機械で弾けるものは1枚残らず機械へ寄せ、人間の希少な判断力を可愛さ・異変の面白さ・最終GOの3点だけに集中させる」こと。これにより人手介入を全工程の3〜4割以下に圧縮しつつ品質を担保する。

採点思想の核: "100点"とは「読者が異変を探して通路に没入し、見つけた瞬間ご褒美エロに自然に流れ込み、文字・崩れ・継ぎ目に一度も現実へ引き戻されない状態」。減点は致命(没入破壊・規約違反) → 一貫性 → 表現価値 → 仕上げの優先順で効く。
二段ゲート(決定論→合議): 寸法・幾何・面積・類似度など決定論で測れるものはPython/OpenCV/embedding/OCRで先にKill判定。「萌え/抜け/異変の面白さ/没入」など感性は4AIアンサンブルの中央値で測る。AI単体は系統バイアスと得点ブレが残るため^[5]、機械と合議で二重に補正する。
三層しきい値: ①致命ゼロ(必須) ②出荷可(機械≥目安かつ4AI中央値が軸別足切りを全通過) ③トフィー基準クリア(高水準＋人間GO)。最終権限は常に人間にある。
継続改善: 失敗を軸別にPareto集計し、5Why/Fishboneで「生成プロンプト/レイヤー設計/写植/モザイク」のどの工程が主因かを特定^[12]。1ループで最も点が上がる工程に絞って直す。
実機最上位の鉄則: AIが「もっとアヘ顔を」と煽っても採用しない(可愛さ最優先ガード)。AIスコアは目安、出荷可否・売れる/売れないの最終判定はトフィーさんの実機。これは既存4AIプロンプトに既に実装済みの方針^[16]。

2市場規模 ― なぜ"出荷ゲート"が金になるか

「100点運用=出荷ゲート」を持つことの価値は、量産しても品質が下振れしない点にある。AI生成同人の最大の弱点は「枚数は出るが当たり外れが大きい」こと。ゲートは"外れ"を出荷前に機械で間引き、人間の目を当たり候補だけに向ける装置である。これは製造業のAQL(抜取検査)/ゼロディフェクト思想と同型で、「1枚の不良流出コスト(評価低下・規約抵触)が、全数自動検査コストを上回る」領域では全数機械検査が合理^[11]。CG集は枚数が有限(数十枚)なので全数機械ゲート＋抜取人間確認が現実解。

9軸

100点の多軸定義

2段

決定論→4AI合議

3層

致命0/出荷可/トフィー基準

~3-4割

人手介入の上限目安

事業的な意味: このゲート資産は本シリーズだけでなく、後続の異変探しシリーズ(終電/ラブホ/学校…)全Volに横展開できる「品質の定規」になる。定規が固定されれば、量産=定規に当てて落ちたものを直すだけの作業に単純化される。

3競合TOP10 ― 採点の物差し(参照基準)

"100点"を恣意でなく外部基準に接地するための参照ソース。AIへ与える正解像のリファレンスかつ、機械しきい値の根拠になる。

#	基準ソース	運用に効く要点	出典
1	品質ゲート(Quality Gate)の定義	次工程へ進む前に満たすべき閾値を強制するチェックポイント。閾値は成熟度・リスク許容度で調整可	^[1]
2	Definition of Done / 受入基準	受入基準=各カット(ストーリー)の門、DoD=作品増分(Vol)の門。粒度を分離せよ	^[2]
3	SonarQube型ゲート思想	"New Code"(今回追加分)と全体を分離して評価=新規レイヤーだけ厳しく見る発想に転用可	^[3]
4	LLM-as-a-judge 信頼性研究	単体judgeはFleiss' κ≈0.3程度・順序/冗長/同調バイアス有。合議で改善するが系統バイアスは残る	^[5]
5	Krippendorff's α(評価者間信頼性)	α≥0.667で中程度・≥0.8で強い一致。4AIの一致度を測る指標として転用	^[6]
6	Laplacian分散ブラー検出	鮮明度=ラプラシアン分散。閾値はデータ依存で要チューニング(目安100前後)	^[7]
7	ArcFaceコサイン類似度	本人判定≧0.6/高品質≧0.5/動画一貫性≧0.7・最新生成は0.85前後。キャラ一貫の機械指標	^[8]
8	拡散モデルの破綻アーティファクト研究	手指・余分指・解剖破綻が代表的崩れ。2025以降は改善傾向だが要検出継続	^[9]
9	FANZAモザイク基準(長辺1/100)	長辺÷100がブロック最小サイズ・4px下限。要確認(公式倫理規定で最終確認)	^[10]
10	AQL/ゼロディフェクト＋PDCA	抜取/全数の使い分け・Pareto/5Why/Fishboneで改善ループを回す型	^[11][12]

4技術スタック ― 9軸100点定義と自動/人手割合

配点は提案初期値(合計100)。同一ベース方式ゆえ異変の明確さ・キャラ一貫・崩れ無し・エロ強度に厚く配点する(=ここで読者が冷める)。各軸を「機械が測れる部分」と「人手/AIが測る部分」に割り振り、機械化率の目標を置く。割合は運用後に実測で再調整。

#	軸	配点	機械(決定論)で測る	人手/AIで測る	機械化率目安
1	背景一致	10	ベースとのピクセル差分/SSIM、レイヤー継ぎ目のエッジ不連続	継ぎ目の"気持ち悪さ"最終確認	~80%
2	異変の明確さ・難易度	15	異変レイヤーの位置・面積・正常版との差分が存在するか	分かる/理不尽でない/簡単すぎない(4AI＋人間)	~40%
3	キャラ一貫	15	顔ArcFace類似度、髪色/目色のHSV帯一致、体型比	小物(ストラップ等)・下着色・髪流れの揃い	~70%
4	崩れ無し	15	手指/余分人物/解剖破綻の検出、NSFW崩壊分類	微妙な破綻の最終目視	~75%
5	エロ強度(萌え/抜け)	15	(補助のみ)露出領域・体液量の存在確認	萌え/抜け/絶頂演出=4AI中央値＋人間	~20%
6	モザイク適正	10	モザイク面積・ブロックサイズが長辺1/100下限以上か^[10]	過剰モザイクで萌え減の確認	~85%
7	写植可読	5	顔領域との重なり/はみ出し/禁則/文節改行^[4]	セリフの色気・棒読み感	~85%
8	構図	10	見せ場の画面占有率・三分割の重心	視線誘導・見せ場の映え	~35%
9	没入(世界観連続性)	5	通路背景・ライト・カウンタ表示の固定性	ループの中毒性・連続性体感	~30%

設計の肝: ①④⑥⑦は機械化率70〜85%と高い=ここを機械に寄せきると人間の負荷が一気に減る。逆に⑤⑧⑨は本質的に感性=ここは4AI＋人間に残す。「機械で測れる軸ほど厳しく自動足切り、感性軸ほど相対評価」が基本姿勢。

機械ゲートの具体ロジック(実装直結)

背景一致: 正常ベースとのSSIM/差分マスク。異変領域以外の差分が閾値超なら継ぎ目事故=Kill候補。
キャラ一貫: 顔検出→ArcFace 512次元embedding→基準カットとのcosine。目安は≥0.6で一貫OK・<0.5でKill(初期値)^[8]。髪/目はHSVヒストグラムの主色帯一致で別途判定(化け色検出)。
崩れ無し: 手領域検出＋指本数推定、人物カウント(意図人数と不一致でKill)、ラプラシアン分散で局所ボケ/溶け検出^[7][9]。
モザイク適正: モザイク矩形のブロック実寸を測り、長辺÷100(最小4px)を下回ればKill^[10]。※倫理規定の最新版で要確認。
写植可読: 顔bboxとテキストbboxのIoU>0でKill(見せ場被り)、フチ無し/禁則/中央寄せ崩れを幾何で検出。

5収益試算＝しきい値設計(三層ゲート)

本シリーズの収益は「品質下振れの無いVolを安定供給できるか」に依存する。よって"試算"の代わりにしきい値設計を示す。既存の出荷ゲート(140点満点中85が合格)を、本9軸(100点系)＋致命ゼロ条件に再マッピングした三層構造。

三層ゲート(初期値・要キャリブレーション)

層	条件(目安)	判定
L0 致命ゼロ	Killスイッチ(§8)が1つも発火しない	必須・1つでも発火→即リテイク
L1 出荷可	機械ゲート総合 ≥ 88(致命ゼロ前提) かつ 4AI中央値 ≥ 90 かつ軸別足切りを全通過	出荷候補(人間最終GO待ち)
L2 トフィー基準	機械・4AI中央値とも ≥ 96 かつトフィーさん実機GO	看板Vol・表紙級

軸別足切り(初期値)

総合点が高くても、没入を壊す軸が1つでも落ちると不合格にする。同一ベース方式で読者が冷める順=厳しめ4軸を設定。

軸	足切り(目安)	理由
背景一致	≥ 8/10	継ぎ目1つで"間違い探し"が成立せず没入崩壊
キャラ一貫	≥ 12/15(ArcFace≥0.6)	顔が別人化すると即バレ・即冷め
崩れ無し	≥ 12/15	手指破綻・余分人物はAI臭の代表
モザイク適正	満点必須(規約)	不足は販売停止リスク=妥協不可

140点満点との対応(既存資産接続): 既存「140中85」を本系に橋渡しするなら、140=9軸100点(技術)＋40点(エロ/萌え魅力ボーナス)と解釈し、85≒「致命ゼロ＋総合6割」=最低出荷ライン、本DRのL1(出荷可)はその上位ラインと位置づける。実際の換算係数は実機サンプルで較正する。※既存ゲートの内訳定義は実装ファイルで要確認。

6リスク＝ AI採点のブレと補正設計

最大のリスクは「AI採点を信じすぎる」こと。研究上、LLM-as-a-judgeは単体でFleiss' κ≈0.3程度の一致しか出ず、順序バイアス・冗長/整形されたものを好むバイアス・自己同調バイアスが知られる^[5]。合議(ジュリー)で安定性は改善するが、系統バイアスは完全には消えない。だからこそ機械ゲートとの二段が必須。

4AIアンサンブルの補正ルール(既存実機ベース)

採点モデル構成: 既存実機はgrok-4.3 / grok-4.20-reasoning / qwen2.5-VL-72b の3系統でR18対応。GPT-4oはR18を拒否するため除外済^[16]。さらに自前スコアラ等を足して"4AI"化する設計。
集約は平均でなく中央値: 1モデルが極端値を出しても中央値なら頑健。さらにモデル間の一致度をKrippendorff's αで監視し、α<0.667(一致が弱い)カットは人間レビュー必須フラグを立てる^[6]。
拒否(refusal)処理: R18拒否応答はnullとして除外し、残モデルで中央値を取る(既存実装にis_ref()あり)。
可愛さ最優先ガード: AIが改善案で「もっとアヘ顔/白目/舌だらり/崩壊/fucked silly」を出しても機械的にBANワード除去し採用しない(既存BANガード済)。崩壊アヘ顔は萌えも抜けもしないという方針はトフィーさん厳命^[16]。
温度固定・同一プロンプト: 採点はtemperature=0.3固定、同一プロンプト・同一画像縮尺(1024長辺)で再現性を上げる(既存実装準拠)。

絶対リスク(MEMORY既知): AIは数値・規約・「売れる/売れない」を自信満々に捏造する。本DRのしきい値・市場前提も二次情報は目安に過ぎない。一次情報(FANZA/DLsite公式規定)とトフィーさんの運用実機が出たら即上書きすること。DLsite AIフロアの作品数上限・FANZAモザイク基準は本DRでも「要確認」扱い^[10][13]。

730日プラン ― 自動化ループ構築

週	やること	成果物
Week1 機械ゲート骨格	9軸の決定論チェックを1スクリプトに統合(`ship_gate.py`)。背景SSIM/ArcFace/手指/モザイク面積/写植IoUを実装。Kill条件を`sys.exit(2)`でブロック化	機械ゲート単体・`gate.json`証跡出力
Week2 4AI接続＆較正	既存`_moe_nuke_4ai`を中央値＋α監視＋BANガードで再整備。20〜30カットで機械点と4AI点の分布を取り初期しきい値を実測で確定	較正済みしきい値表・分布グラフ
Week3 三層ゲート統合	L0/L1/L2を1パイプラインに。落ちたカットを軸別にPareto集計するダッシュボード化。人間GO用の抜取UI(候補のみ提示)	出荷ゲート統合版＋失敗Pareto表
Week4 改善ループ実証	1Vol分を通し、Pareto上位軸を5Why/Fishboneで工程特定→1工程だけ直して再採点。中央値の改善幅を記録し回し方を確定	改善前後差レポート・運用Runbook

自動化の到達点: 30日後の理想は「生成→機械ゲート(全数)→落ちたものを自動でリテイク指示→通ったものだけ4AI→人間は候補リストの可愛さ・面白さ・最終GOだけ見る」。人間が画像を1枚ずつ全部見る運用から卒業する。

8撤退ライン＝ Killスイッチ即没条件

1つでも発火したら採点せず即リテイク(L0で弾く)。全て機械検出可能を原則とし、人間の目を使わせない。

即没Killスイッチ(機械検出)

モザイク不足: ブロック実寸 < 長辺1/100(最小4px) → 規約抵触で販売不可^[10]
キャラ別人化: 顔ArcFace cosine < 0.5(基準カット比・初期値)^[8]
背景継ぎ目事故: 異変領域外の差分が閾値超(レイヤーズレ・別背景混入)
余分人物/人数違反: 意図人数と検出人数が不一致(1girl作品に2人目混入)
手指/解剖破綻: 指本数異常・溶け・余分肢を検出^[9]
写植が見せ場被り: 顔/性器bboxとテキストbboxのIoU>0
髪色/目色の化け: 定義主色帯から外れる(金髪→黒/青等)

即没Killスイッチ(人間/AIガード)

主人公が子供/ショタに見える: R18コンプラ最優先・絶対NG(MEMORY厳命)
崩壊アヘ顔/白目/舌だらり: 可愛さを壊す=萌えも抜けもしない(可愛い絶頂顔へ差替)^[16]
立ち絵/日常コマに喘ぎ・絶頂SFX: 絵と音の不一致(実際のエロ行為コマのみ許可)

9落とし穴 ― 96点止まりの真因

表紙基準で中身を採点する: 表紙(平台映え・ロゴ視認性)と中身(没入・可読・見せ場尊重)は基準が別物。混ぜると永久に届かない。ゲートを2系統に分離せよ。
AIの煽りループ: 辛口AIが毎回「もっとアヘ顔/崩壊」を推奨→鵜呑みで次生成を強化→可愛さが死ぬ正のループ。BANガードで遮断し可愛さ最優先^[16]。
感性軸を機械で測ろうとする: 没入・萌えを無理にCV指標化すると見当外れの数字が出る。感性は4AI＋人間に潔く残す。
機械で弾けるものを人間に見せる: モザイク不足や手指破綻を人間が目視する運用は時間の浪費。全部L0(機械Kill)へ。
絵がボトルネックなのに写植を直す: 抜けの天井は多くの場合絵(結合部・絶頂顔)側。Pareto集計で「どの軸が落ちているか」を見ずに工程を選ぶと点が動かない^[12]。
AI採点の一致度を見ない: 4AIがバラけた(α<0.667)カットを"平均点"で出荷判定するのは危険。不一致カットは人間必須に回す^[6]。
規約数値を二次情報で確定: モザイク・AIフロア上限は必ず公式/実機で裏取り。本DR内の数値も初期値・要確認^[10][13]。

10既存資産活用 ― CC3/4AIへの接続

本設計は新規構築でなく既存資産の束ね直し。接続点は以下。

既存資産	役割	本ゲートでの接続
品質ゲート9軸 (`r18_quality_gate.html`)	R18画像の9軸加重採点・Killスイッチ	本9軸へ写経・加重を異変探し用に再配点(背景一致/異変軸を追加)
4AI評価 (`_moe_nuke_4ai_2026-06-13.py`)	grok43/grok420r/qwen-VLで萌え/抜け採点・BANガード	L1の感性レイヤーへ。中央値＋α監視を追加実装
出荷ゲート(140/85)	最低出荷ライン	L1の下限として較正接続(換算係数は実測)
CC3 TypesetGate (`_cc3_typeset_gate_2026-06-12.py`・要存在確認)	写植の顔回避・禁則・配置検証	軸⑦写植可読の機械判定として直結
LoRA一貫性4AI (`_cc1_4ai_eval_2026-06-11.py`)	キャラ全属性固定の24項目チェック	軸③キャラ一貫のembedding判定の上流QC
`grok_router.py`	全Grok呼び出しの一元化・コストログ	採点・改善提案の全LLM呼び出しを集約・`grok_router_costs.jsonl`に記録

次の一手(推奨): Week1でship_gate.pyを新規作成し、上記をimportで接続。出力はgate.json(各軸点・Kill理由・4AI中央値・α)をD:\projects\fanza3_mass\gates\へ証跡保存。量産ドライバのpreflight()が未合格をsys.exit(2)でブロックする既存パターンに合流させる。

11関連DR一覧

DR_写植100点の定義と減点チェックリスト_4AI自動採点項目_2026-06-12.html ― 軸⑦写植の詳細減点(35項目)。本DRの写植軸はこれを参照
DR_R18採点ルーブリック_合格点ゲート設計_2026-05-30.html ― 合格点ゲートの原型
DR_CCが指示を守らない根本原因_チェックリスト合格点ゲート評価ループ設計_2026-05-30.html ― 評価ループの根本設計
DR_AIエロ漫画自動品質評価システム設計_複数LLM採点誤判定回避人間目視_2026-06-09.html ― 複数LLM採点の誤判定回避
DR_キャラ一貫性の自動QC_多視点AI評価パイプライン_2026-06-11.html ― 軸③キャラ一貫の自動QC
DR_異変探しエロCG集の商品設計と売れ筋_2026-06-12.html / DR_異変探しフォーマット構造分析とエロ転用設計_2026-06-12.html ― 軸②異変の難易度設計
DR_R18_CG品質指標化_科学的管理_2026-05-26.html ― 品質の指標化思想
DR_R18NSFW採点できるVisionAI調査と実装_2026-06-10.html / DR_R18自動採点パイプライン_ローカルNSFW_VLMアンサンブル実装_2026-06-10.html ― 採点VLM実装
DR_世界一厳しめ評価ルーブリックとエロ漫画作劇_2026-06-11.html ― 厳しめ採点の作劇連動

12脚注(全URL・実在ソース)

引用ソース

What is a quality gate? — TechTarget: https://www.techtarget.com/searchsoftwarequality/definition/quality-gate
How to compare acceptance criteria vs. definition of done — TechTarget: https://www.techtarget.com/searchsoftwarequality/tip/How-to-compare-acceptance-criteria-vs-definition-of-done
What are quality gates in software development — Sonar: https://www.sonarsource.com/resources/library/quality-gate/
Quality Gates in Testing: Framework, Metrics & Best Practices — testomat.io: https://testomat.io/blog/what-are-quality-gates-and-how-will-they-help-your-project/
LLM-as-a-Judge: reliability & bias — Adaline: https://www.adaline.ai/blog/llm-as-a-judge-reliability-bias
Krippendorff's Alpha for Annotation Agreement — Label Studio: https://labelstud.io/blog/how-to-use-krippendorff-s-alpha-to-measure-annotation-agreement/
Blur detection with OpenCV (variance of Laplacian) — PyImageSearch: https://pyimagesearch.com/2015/09/07/blur-detection-with-opencv/
A Gentle Introduction to Face-Sim (ArcFace cosine similarity) — Zenn: https://zenn.dev/taku_sid/articles/20250511_face_sim_metric?locale=en
Characterizing Photorealism and Artifacts in Diffusion Model-Generated Images — arXiv: https://arxiv.org/html/2502.11989
【FANZA同人】モザイク修正について(長辺1/100基準・要公式確認) — note/miyochinAI: https://note.com/miyochinai/n/nb4af0981eb9d
Zero-defect vs AQL inspection in precision manufacturing — PatSnap: https://www.patsnap.com/resources/blog/articles/zero-defect-vs-aql-inspection-in-precision-manufacturing/
PDCA Problem Solving / Root Cause (Pareto・5Why・Fishbone) — agility-at-scale: https://agility-at-scale.com/safe/learning-culture/pdca-problem-solving/
DLsiteに「AI生成フロア」が新設(作品数上限は要実機確認) — 窓の杜: https://forest.watch.impress.co.jp/docs/news/1569791.html
『8番出口』異変探しゲームのヒット要因・派生 — 4Gamer: https://www.4gamer.net/games/751/G075133/20241227008/
Acceptable Quality Level (AQL) Ultimate Guide — SixSigma.us: https://www.6sigma.us/six-sigma-in-focus/acceptable-quality-level-aql/
実機方針(4AI=grok43/grok420r/qwen-VL・GPT-4o除外・可愛い絶頂顔/アヘ顔BANガード・トフィーさん実機最上位) — 制作チーム内部実装 D:\projects\_ero8_ref\_moe_nuke_4ai_2026-06-13.py および MEMORY.md(一次=運用実機)

※[10][13]は二次情報。販売規約・AIフロア上限・モザイク基準はFANZA/DLsite公式の最新倫理規定とトフィーさんの運用実機を最上位とし、相違があれば即上書きすること。本DRのしきい値・配点は全て初期値=要キャリブレーション。点数および「売れる/売れない」の最終判定はトフィーさんの実機判定が最上位。

1結論 ― 100点運用の核

2市場規模 ― なぜ"出荷ゲート"が金になるか

3競合TOP10 ― 採点の物差し(参照基準)

4技術スタック ― 9軸100点定義と自動/人手割合

機械ゲートの具体ロジック(実装直結)

5収益試算 ＝ しきい値設計(三層ゲート)

三層ゲート(初期値・要キャリブレーション)

軸別足切り(初期値)

6リスク ＝ AI採点のブレと補正設計

4AIアンサンブルの補正ルール(既存実機ベース)

730日プラン ― 自動化ループ構築

8撤退ライン ＝ Killスイッチ即没条件

9落とし穴 ― 96点止まりの真因

10既存資産活用 ― CC3/4AIへの接続

11関連DR一覧

12脚注(全URL・実在ソース)

引用ソース

5収益試算＝しきい値設計(三層ゲート)

6リスク＝ AI採点のブレと補正設計

8撤退ライン＝ Killスイッチ即没条件