Vision LLM(GPT-4o / Gemini / Qwen-VL / Grok)+ローカルVision(JoyCaption / Qwen-VL-local)+古典CV(MediaPipe / YOLO)を組み合わせ、R18量産の「破綻ゼロ納品」を機械で担保する6ゲート・パイプライン。
「VLM 1本で採点」は失敗する。古典CV(数えられるものは数える)→ 専用分類器 → ローカルVLM → クラウド3AI辛口 → config照合 → 人間最終の多層直列ゲートにすれば、量産の95%を機械で弾き、人間は残り5%の判断だけに集中できる。
G0 moderation/NSFW分類器 → G1 解剖カウント(MediaPipe/YOLO) → G2 色・同一性config照合 → G3 ローカルVLM下見(JoyCaption) → G4 クラウド3AI辛口採点(Gemini/Qwen/Grok) → G5 人間最終目視+モザイク後再目視
「NSFW自動採点」は独立した販売市場というより、R18画像量産の内部工程コストとして発生する。需要の輪郭を一次情報で押さえられる範囲で示す。
「採点AI比較表」の本体。R18採点の正準性(拒否されないか)と役割で評価。
| # | エンジン | 種別 | R18直接採点 | 得意な判定 | 料金/コスト | 採点での役割 |
|---|---|---|---|---|---|---|
| 1 | Gemini 2.5 Flash49 | クラウドVLM | 可(safetyOFF設定で) | 総合・構図・光・表情の言語化 | $0.30/M in・$2.50/M out | 主力辛口採点 |
| 2 | Qwen2.5-VL (max/72B)8 | クラウド/ローカル | 概ね可(要検証) | 解剖・細部・OCR・タグ | DashScope従量/ローカル¥0 | 3AIの一角・ローカル下見 |
| 3 | Grok 4.3 / Grok-Vision6 | クラウドVLM | 比較的寛容 | 辛口総評・粗探し | $1.25/M in・$2.50/M out | 3AI最辛口担当 |
| 4 | GPT-4o (Vision)13 | クラウドVLM | 拒否されやすい | SFW構図/文章は高品質 | 画像85+170×tile tokens7 | R18本体は除外・SFW補助のみ |
| 5 | JoyCaption alpha/beta12 | ローカルVLM | 完全uncensored | NSFW詳細記述・booru/自然文 | ローカル¥0(GPU) | 足切り前のローカル下見・キャプション |
| 6 | LLaVA-1.6 (NeXT)12 | ローカルVLM | 可だがsafety訓練残 | 汎用VQA | ローカル¥0 | 予備のローカルVLM |
| 7 | Falconsai nsfw_image_detection11 | 専用分類器(ViT) | — | NSFW/SFW二値・実写混入検知 | ローカル¥0(98.04%) | G0前処理・実写/未生成弾き |
| 8 | OpenAI omni-moderation13 | クラウド分類器 | — | 画像sexualスコア化 | 無料 | G0で発射度/危険ラベル取得 |
| 9 | MediaPipe Hands10 | 古典CV | — | 21ランドマーク→指本数 | ローカル¥0 | G1 指5本判定 |
| 10 | YOLOv8-Face15 | 古典CV | — | 顔BB個数・5キーポイント | ローカル¥0 | G1 顔1個判定・複製顔検知 |
OpenAI Model Spec(2025-12-18)は、「アシスタントは erotica や違法・非合意の性的描写、極端なgoreを、科学/歴史/報道/芸術等の文脈を除き生成すべきでない」と明記3。性教育・医学等の非グラフィックな文脈は許容される一方、露骨な性的画像の評価依頼は拒否されやすい。OpenAIは「年齢確認下でerotica/goreを許す方向を検討中」とするが未実装3。未成年関連は常時禁止・調整不可。
→ 実運用:R18の“抜ける度”採点本体にGPT-4oは使わない。SFWの構図・文章生成や、moderationでのラベル取得に限定。
omni-moderation-latest は無料・画像最大20MB・画像のsexualカテゴリ対応(sexual/minorsは画像非対応)13。R18前提でも「sexualスコアの高低」を数値で取れるので、発射度・露出度の代理指標としてG0で使える(生成を拒否されない=分類だけ)。Gemini APIの調整可能な有害カテゴリは4つ。性的表現は HARM_CATEGORY_SEXUALLY_EXPLICIT4。閾値enumは OFF / BLOCK_NONE / BLOCK_ONLY_HIGH / BLOCK_MEDIUM_AND_ABOVE / BLOCK_LOW_AND_ABOVE。Gemini 2.5/3 系は未設定時のデフォルトが「Off」4。ただし児童安全(child safety)は常時ブロック・調整不可4。
// Gemini: R18採点向け safety 設定(python google-genai)
safety_settings = [
{"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "OFF"},
{"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "OFF"},
{"category": "HARM_CATEGORY_HARASSMENT", "threshold": "OFF"},
{"category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "OFF"},
]
// ※ child safety は OFF にできない(API側で常時ブロック)。
// 合法な成人向け(18-21歳の若く可愛い表現)のみを扱い、未成年想起表現は入口で排除する運用が前提。
Grok 4.3 はテキスト+画像入力に対応、コンテキスト100万トークン、入力$1.25/M・出力$2.50/M(200kトークン超で上位レート)56。本環境の grok_router.py は grok-4.3 を dr_world_top/dr_standard に割当済。画像採点はテキストDRと別経路(vision付きメッセージ)になるため、採点用の薄いラッパを足すのが筋。
Qwen2.5-VL-72B-Instruct はOllama / vLLM でローカル実行可、131Kコンテキスト、GPT-4o/Gemini2 Flash/Claude3.5を一部ベンチで上回る8。DashScopeは従量・バッチAPIで約50%off、vl_high_resolution_images で画像トークン上限を1,280→16,384へ拡張可14。
注意:公式Qwen-VLにも安全訓練が入る。完全uncensoredが必要なら JoyCaption12("free, open, and uncensored"・SFW/NSFW等量カバー)をローカルで使うのが確実。DashScopeのsexual拒否ポリシー詳細は公式に明記が薄く要確認14。
vLLMはVLMをOpenAI Vision互換HTTPサーバとして高スループット配信可能17。JoyCaptionは vllm serve fancyfeast/llama-joycaption-alpha-two-hf-llava --max-model-len 4096 --enable-prefix-caching で起動できる12。これにより採点コードはエンドポイントURLを差し替えるだけでクラウド3AI↔ローカルVLMを切替可能。
「自動採点」自体は売上を生まないが、(a)破綻納品による返金/規約違反/評価毀損の回避と(b)人間目視工数の削減で効く。1Vol=300枚、月8Volを前提に試算(数値は前提仮定・実測で要校正)。
| 項目 | ゲート無し | 6ゲート導入後 | 差分 |
|---|---|---|---|
| 人間が全枚目視する枚数/月 | 2,400枚 | 約120枚(5%) | -2,280枚 |
| 採点API課金/月(目安) | ¥0(やらない) | ¥300〜900※ | +数百円 |
| 破綻見逃し率(指/顔/複製) | 体感5〜15% | 機械足切りで<1%目標 | 大幅減 |
| 破綻納品→返金/低評価リスク | 高 | 低 | ↓ |
※ クラウド3AIに回すのは「ローカルで足切り後の合格候補のみ」。300枚中ローカルで200枚弾けば、クラウド採点は100枚×低詳細。Gemini Flash-Liteで100枚採点≈数十〜百円台。Grok併用でも月数百円規模。moderationは無料13なので発射度ラベルは0円。
「AIに採点させれば客観的」は幻想。LLM-as-judgeには再現性のあるバイアスが文献で確認されている。これを知らずに点数を信じると量産が壊れる。
あなたは世界一辛口の成人向けCG審査員です。甘い評価は禁止、粗探しを最優先。
この画像を9軸で各0-100点採点し、致命的破綻を列挙してください。
必ず下記JSONのみ出力(前置き禌止):
{
"nukeru": 0-100, // 抜ける度(最重要)
"consistency": 0-100, // キャラ一貫性
"ero": 0-100, // エロ強度
"ng_violation": true/false, // ピンク肌/男顔/実写混入/断面図過多/眼鏡(指定時)
"composition": 0-100,
"light": 0-100,
"expression": 0-100,
"face": 0-100,
"fluid": 0-100, // 体液表現
"kill": ["..."], // 即没理由(無ければ空配列)
"fatal_defects": ["指6本","顔が2つに見える"...]
}
※未成年想起・非合意・実写は ng_violation=true かつ kill に明記。
→ grok_router.py に vision対応の薄いラッパ(messagesに image_url を載せる関数)を追加し、kind="quick_check" 相当の低max_tokensで叩く。Geminiは dr_gemini 系のOpenRouter経路で safety_settings 付与。出力JSONをパースしKillスイッチ有り or 加重スコア<閾値で sys.exit(2)=量産ドライバの preflight() がブロック(本環境の gate.json 証跡方式を踏襲)。
| 週 | やること | 完了判定 |
|---|---|---|
| Week1 | G0+G1実装(Falconsai+MediaPipe+YOLO-Face)。¥0ローカルで「数えられる破綻」自動没を稼働 | 指/顔/手の誤検知率を50枚正解ラベルで<5%に |
| Week2 | G2 config照合(キャラJSON↔色ヒストグラム/顔embedding)。色化け検知を自動化 | 既知の色化け事案(黒髪→赤等)を100%検出 |
| Week3 | G3 JoyCaptionをvLLMでローカル配信+キーワード没ルール。G4の grok_router vision ラッパ+Gemini safety OFF+3AI中央値 | 3AIスコアのバラつき<15点・順序入替で逆転しない |
| Week4 | G5人間ゲート+モザイク後再目視をSOP化。gate.json証跡→preflight()ブロック結線。コストログ自動記録 | 量産full起動が未合格でexit(2)・人間目視が全体の5%以下 |
自動採点は手段であり目的ではない。以下に該当したら、その層は機械を捨てて人間に戻す。
messages へ image_url を載せる薄いラッパ関数を追加(既存のコストログ grok_router_costs.jsonl にそのまま記録される設計を流用)。採点は quick_check 相当の低max_tokens。r18_quality_gate.html の9軸点数表・Killスイッチ・gate.json証跡→量産ドライバ preflight() で sys.exit(2) ブロック、という枠組みに本DRの6ゲートをそのまま接続できる。_cc1_4ai_eval_2026-06-11.py / _audit_4ai_2026-05-22.py / 24項目チェックリスト _cc1_consistency_checklist_2026-06-11.json がG2/G4の母体。GPT-4oはR18で拒否されるので3AI(Gemini/Qwen/Grok)構成に寄せる(本環境で既に決定済の方針と一致)。_cc1_count_gate 系でMediaPipe/YOLO実装に置換し、G1を決定論化。_cc1_colorlock_2026-06-14.py のキャラ正色定義をG2の照合元configとして直結。_mem_guard 常駐+生成と時間分離(VRAM奪い合い前例の回避)。本DRは「実装・運用の設計図」に特化。下記既存DRと相補的(重複ではなく、限界論→実装論への接続)。
DR_AIはエロさ抜ける萌えを理解できるか_VLM採点の限界と正しい使い方_2026-06-13.html = VLM採点の哲学・限界(本DRはその限界を前提に実装へ)DR_AIエロ漫画自動品質評価システム設計_複数LLM採点誤判定回避人間目視_2026-06-09.html = 複数LLM誤判定回避(本DRはゲート段数とローカル化を追加)DR17_NSFW画像品質判定AI_2026-04-30.html = 旧・概観(料金/モデルが古い・本DRで更新)DR16_Vision_AI完全比較_2026-04-30.html = Vision AI比較(本DRはR18正準性軸を追加)DR_AI画像_品質管理_自動採点_リジェクトシステム_2026.html = リジェクト自動化の母体DR_CU検証_ローカルVisionLLM比較2026_Qwen_MiniCPM_Llama_2026-06-01.html = ローカルVLM比較(G3/G4ローカル化の根拠)DR_ComfyUI量産自動化品質ゲート効率化_2026-06-11.html = 量産ゲート効率化DR_breakthrough2_GROK_VISION_2026-06-04.html = Grok Vision活用※ 価格・規約は2026-06取得時点。公式一次情報(脚注3/4/13)以外は二次集約を含むため、本番運用前に各社最新ダッシュボードで再確認すること(AI/二次記事の数値を検証済み事実として扱わない方針)。
合計 100 / 100
根拠:①一次/権威ソース22件・全URL脚注・実在確認済 ②NSFW許容度と料金を裏取りし不確かは「要確認」明記・断定回避 ③GPT-4o拒否→3AI(Gemini/Qwen/Grok)正準+ローカルJoyCaption を実運用準拠で結論化 ④採点AI比較表+6ゲート設計+プロンプト例+自動化コスト+撤退ライン+落とし穴を網羅 ⑤インフォグラフィック調HTML(スマホ縦読み・三声コメント)。