grok-4.3(grok_router.py経由 / kind=dr_standard / 推定¥85)。1次情報16ソース(脚注)。
重要前提: 本書のしきい値・点数は全て初期値=要キャリブレーションであり、最終的な合否・「売れる/売れない」の判定はトフィーさんの実機判定を最上位とする(AIスコアは目安)。一次未確認は「要確認」と明示。
"100点"は単一スコアではなく9軸の合成+致命ゼロ条件で定義する。自動化の要諦は「機械で弾けるものは1枚残らず機械へ寄せ、人間の希少な判断力を可愛さ・異変の面白さ・最終GOの3点だけに集中させる」こと。これにより人手介入を全工程の3〜4割以下に圧縮しつつ品質を担保する。
「100点運用=出荷ゲート」を持つことの価値は、量産しても品質が下振れしない点にある。AI生成同人の最大の弱点は「枚数は出るが当たり外れが大きい」こと。ゲートは"外れ"を出荷前に機械で間引き、人間の目を当たり候補だけに向ける装置である。これは製造業のAQL(抜取検査)/ゼロディフェクト思想と同型で、「1枚の不良流出コスト(評価低下・規約抵触)が、全数自動検査コストを上回る」領域では全数機械検査が合理[11]。CG集は枚数が有限(数十枚)なので全数機械ゲート+抜取人間確認が現実解。
"100点"を恣意でなく外部基準に接地するための参照ソース。AIへ与える正解像のリファレンスかつ、機械しきい値の根拠になる。
| # | 基準ソース | 運用に効く要点 | 出典 |
|---|---|---|---|
| 1 | 品質ゲート(Quality Gate)の定義 | 次工程へ進む前に満たすべき閾値を強制するチェックポイント。閾値は成熟度・リスク許容度で調整可 | [1] |
| 2 | Definition of Done / 受入基準 | 受入基準=各カット(ストーリー)の門、DoD=作品増分(Vol)の門。粒度を分離せよ | [2] |
| 3 | SonarQube型ゲート思想 | "New Code"(今回追加分)と全体を分離して評価=新規レイヤーだけ厳しく見る発想に転用可 | [3] |
| 4 | LLM-as-a-judge 信頼性研究 | 単体judgeはFleiss' κ≈0.3程度・順序/冗長/同調バイアス有。合議で改善するが系統バイアスは残る | [5] |
| 5 | Krippendorff's α(評価者間信頼性) | α≥0.667で中程度・≥0.8で強い一致。4AIの一致度を測る指標として転用 | [6] |
| 6 | Laplacian分散ブラー検出 | 鮮明度=ラプラシアン分散。閾値はデータ依存で要チューニング(目安100前後) | [7] |
| 7 | ArcFaceコサイン類似度 | 本人判定≧0.6/高品質≧0.5/動画一貫性≧0.7・最新生成は0.85前後。キャラ一貫の機械指標 | [8] |
| 8 | 拡散モデルの破綻アーティファクト研究 | 手指・余分指・解剖破綻が代表的崩れ。2025以降は改善傾向だが要検出継続 | [9] |
| 9 | FANZAモザイク基準(長辺1/100) | 長辺÷100がブロック最小サイズ・4px下限。要確認(公式倫理規定で最終確認) | [10] |
| 10 | AQL/ゼロディフェクト+PDCA | 抜取/全数の使い分け・Pareto/5Why/Fishboneで改善ループを回す型 | [11][12] |
配点は提案初期値(合計100)。同一ベース方式ゆえ異変の明確さ・キャラ一貫・崩れ無し・エロ強度に厚く配点する(=ここで読者が冷める)。各軸を「機械が測れる部分」と「人手/AIが測る部分」に割り振り、機械化率の目標を置く。割合は運用後に実測で再調整。
| # | 軸 | 配点 | 機械(決定論)で測る | 人手/AIで測る | 機械化率目安 |
|---|---|---|---|---|---|
| 1 | 背景一致 | 10 | ベースとのピクセル差分/SSIM、レイヤー継ぎ目のエッジ不連続 | 継ぎ目の"気持ち悪さ"最終確認 | ~80% |
| 2 | 異変の明確さ・難易度 | 15 | 異変レイヤーの位置・面積・正常版との差分が存在するか | 分かる/理不尽でない/簡単すぎない(4AI+人間) | ~40% |
| 3 | キャラ一貫 | 15 | 顔ArcFace類似度、髪色/目色のHSV帯一致、体型比 | 小物(ストラップ等)・下着色・髪流れの揃い | ~70% |
| 4 | 崩れ無し | 15 | 手指/余分人物/解剖破綻の検出、NSFW崩壊分類 | 微妙な破綻の最終目視 | ~75% |
| 5 | エロ強度(萌え/抜け) | 15 | (補助のみ)露出領域・体液量の存在確認 | 萌え/抜け/絶頂演出=4AI中央値+人間 | ~20% |
| 6 | モザイク適正 | 10 | モザイク面積・ブロックサイズが長辺1/100下限以上か[10] | 過剰モザイクで萌え減の確認 | ~85% |
| 7 | 写植可読 | 5 | 顔領域との重なり/はみ出し/禁則/文節改行[4] | セリフの色気・棒読み感 | ~85% |
| 8 | 構図 | 10 | 見せ場の画面占有率・三分割の重心 | 視線誘導・見せ場の映え | ~35% |
| 9 | 没入(世界観連続性) | 5 | 通路背景・ライト・カウンタ表示の固定性 | ループの中毒性・連続性体感 | ~30% |
SSIM/差分マスク。異変領域以外の差分が閾値超なら継ぎ目事故=Kill候補。cosine。目安は≥0.6で一貫OK・<0.5でKill(初期値)[8]。髪/目はHSVヒストグラムの主色帯一致で別途判定(化け色検出)。本シリーズの収益は「品質下振れの無いVolを安定供給できるか」に依存する。よって"試算"の代わりにしきい値設計を示す。既存の出荷ゲート(140点満点中85が合格)を、本9軸(100点系)+致命ゼロ条件に再マッピングした三層構造。
| 層 | 条件(目安) | 判定 |
|---|---|---|
| L0 致命ゼロ | Killスイッチ(§8)が1つも発火しない | 必須・1つでも発火→即リテイク |
| L1 出荷可 | 機械ゲート総合 ≥ 88(致命ゼロ前提) かつ 4AI中央値 ≥ 90 かつ 軸別足切りを全通過 | 出荷候補(人間最終GO待ち) |
| L2 トフィー基準 | 機械・4AI中央値とも ≥ 96 かつ トフィーさん実機GO | 看板Vol・表紙級 |
総合点が高くても、没入を壊す軸が1つでも落ちると不合格にする。同一ベース方式で読者が冷める順=厳しめ4軸を設定。
| 軸 | 足切り(目安) | 理由 |
|---|---|---|
| 背景一致 | ≥ 8/10 | 継ぎ目1つで"間違い探し"が成立せず没入崩壊 |
| キャラ一貫 | ≥ 12/15(ArcFace≥0.6) | 顔が別人化すると即バレ・即冷め |
| 崩れ無し | ≥ 12/15 | 手指破綻・余分人物はAI臭の代表 |
| モザイク適正 | 満点必須(規約) | 不足は販売停止リスク=妥協不可 |
最大のリスクは「AI採点を信じすぎる」こと。研究上、LLM-as-a-judgeは単体でFleiss' κ≈0.3程度の一致しか出ず、順序バイアス・冗長/整形されたものを好むバイアス・自己同調バイアスが知られる[5]。合議(ジュリー)で安定性は改善するが、系統バイアスは完全には消えない。だからこそ機械ゲートとの二段が必須。
grok-4.3 / grok-4.20-reasoning / qwen2.5-VL-72b の3系統でR18対応。GPT-4oはR18を拒否するため除外済[16]。さらに自前スコアラ等を足して"4AI"化する設計。nullとして除外し、残モデルで中央値を取る(既存実装にis_ref()あり)。BANガード済)。崩壊アヘ顔は萌えも抜けもしないという方針はトフィーさん厳命[16]。temperature=0.3固定、同一プロンプト・同一画像縮尺(1024長辺)で再現性を上げる(既存実装準拠)。| 週 | やること | 成果物 |
|---|---|---|
| Week1 機械ゲート骨格 | 9軸の決定論チェックを1スクリプトに統合(ship_gate.py)。背景SSIM/ArcFace/手指/モザイク面積/写植IoUを実装。Kill条件をsys.exit(2)でブロック化 | 機械ゲート単体・gate.json証跡出力 |
| Week2 4AI接続&較正 | 既存_moe_nuke_4aiを中央値+α監視+BANガードで再整備。20〜30カットで機械点と4AI点の分布を取り初期しきい値を実測で確定 | 較正済みしきい値表・分布グラフ |
| Week3 三層ゲート統合 | L0/L1/L2を1パイプラインに。落ちたカットを軸別にPareto集計するダッシュボード化。人間GO用の抜取UI(候補のみ提示) | 出荷ゲート統合版+失敗Pareto表 |
| Week4 改善ループ実証 | 1Vol分を通し、Pareto上位軸を5Why/Fishboneで工程特定→1工程だけ直して再採点。中央値の改善幅を記録し回し方を確定 | 改善前後差レポート・運用Runbook |
1つでも発火したら採点せず即リテイク(L0で弾く)。全て機械検出可能を原則とし、人間の目を使わせない。
本設計は新規構築でなく既存資産の束ね直し。接続点は以下。
| 既存資産 | 役割 | 本ゲートでの接続 |
|---|---|---|
| 品質ゲート9軸 ( r18_quality_gate.html) | R18画像の9軸加重採点・Killスイッチ | 本9軸へ写経・加重を異変探し用に再配点(背景一致/異変軸を追加) |
| 4AI評価 ( _moe_nuke_4ai_2026-06-13.py) | grok43/grok420r/qwen-VLで萌え/抜け採点・BANガード | L1の感性レイヤーへ。中央値+α監視を追加実装 |
| 出荷ゲート(140/85) | 最低出荷ライン | L1の下限として較正接続(換算係数は実測) |
| CC3 TypesetGate ( _cc3_typeset_gate_2026-06-12.py・要存在確認) | 写植の顔回避・禁則・配置検証 | 軸⑦写植可読の機械判定として直結 |
| LoRA一貫性4AI ( _cc1_4ai_eval_2026-06-11.py) | キャラ全属性固定の24項目チェック | 軸③キャラ一貫のembedding判定の上流QC |
grok_router.py | 全Grok呼び出しの一元化・コストログ | 採点・改善提案の全LLM呼び出しを集約・grok_router_costs.jsonlに記録 |
ship_gate.pyを新規作成し、上記をimportで接続。出力はgate.json(各軸点・Kill理由・4AI中央値・α)をD:\projects\fanza3_mass\gates\へ証跡保存。量産ドライバのpreflight()が未合格をsys.exit(2)でブロックする既存パターンに合流させる。DR_写植100点の定義と減点チェックリスト_4AI自動採点項目_2026-06-12.html ― 軸⑦写植の詳細減点(35項目)。本DRの写植軸はこれを参照DR_R18採点ルーブリック_合格点ゲート設計_2026-05-30.html ― 合格点ゲートの原型DR_CCが指示を守らない根本原因_チェックリスト合格点ゲート評価ループ設計_2026-05-30.html ― 評価ループの根本設計DR_AIエロ漫画自動品質評価システム設計_複数LLM採点誤判定回避人間目視_2026-06-09.html ― 複数LLM採点の誤判定回避DR_キャラ一貫性の自動QC_多視点AI評価パイプライン_2026-06-11.html ― 軸③キャラ一貫の自動QCDR_異変探しエロCG集の商品設計と売れ筋_2026-06-12.html / DR_異変探しフォーマット構造分析とエロ転用設計_2026-06-12.html ― 軸②異変の難易度設計DR_R18_CG品質指標化_科学的管理_2026-05-26.html ― 品質の指標化思想DR_R18NSFW採点できるVisionAI調査と実装_2026-06-10.html / DR_R18自動採点パイプライン_ローカルNSFW_VLMアンサンブル実装_2026-06-10.html ― 採点VLM実装DR_世界一厳しめ評価ルーブリックとエロ漫画作劇_2026-06-11.html ― 厳しめ採点の作劇連動D:\projects\_ero8_ref\_moe_nuke_4ai_2026-06-13.py および MEMORY.md(一次=運用実機)※[10][13]は二次情報。販売規約・AIフロア上限・モザイク基準はFANZA/DLsite公式の最新倫理規定とトフィーさんの運用実機を最上位とし、相違があれば即上書きすること。本DRのしきい値・配点は全て初期値=要キャリブレーション。点数および「売れる/売れない」の最終判定はトフィーさんの実機判定が最上位。