huihui-ai/Qwen2.5-VL-7B-Instruct-abliterated 等が refusal回路除去済で実在[3][4]。GGUF+mmproj同梱版(bartowski / prithivMLmods)も実在しLM Studio/llama.cppで動く[5][6]。① クラウドの本当の抜け道は Featherless.ai。20,000超のHFモデルをserverless serveでき、vision対応・OpenAI互換・月額flat rate。ここに huihui-ai系abliterated VLM を載せれば「Grok以外に非拒否クラウドVLMが無い」前提が崩れる[7][8]。
② ローカルの抜け道は abliterated VLM。素のQwen2.5-VL/Llama-3.2-Visionは安全層で拒否するが、refusal方向ベクトルを重みから除去した abliterated 版が複数実在し、GGUF(mmproj同梱)でLM Studio即運用可[3][5]。
③ 絶対に止まらない最終保険は「2段審判+OpenCV/PILルールスコアラ」。画像をVLMに見せない設計なので原理的にrefusalが発生しない。
2026-06-10にCC向けの近接DRが2本ある(DR_R18NSFW採点できるVisionAI調査と実装 と DR_R18自動採点パイプライン_ローカルNSFW_VLMアンサンブル実装)。両者は「Grok主力+ToriiGate/JoyCaption/WD-Tagger/thesbyのローカル4本立て」までを確定させた。本DRはトフィーさんの依頼通り、そこに載っていない選択肢=(a)非検閲クラウドプロキシ群、(b)abliterated VLM、(c)2段テキスト審判、(d)自前ルールスコアラだけを深掘りする「穴埋め版」。重複部分は再掲せず、差分のみを濃く書く。
| 層 | 追加候補(既知以外) | 用途 | 非拒否 | 導入 |
|---|---|---|---|---|
| クラウド追加① | Featherless.ai + huihui Qwen3-VL-8B-abliterated | 非拒否クラウド採点・Grokの代替/補完票 | 最高(abliterated) | 中 |
| クラウド追加② | Venice.ai(Qwen3-VL-235B / GLM-V) | uncensored明言の大型VLM採点 | 高 | 低(OpenAI互換) |
| クラウド追加③(条件) | DeepInfra / Hyperbolic / Together(VL系) | 通れば第3票。モデルID次第 | プロバイダ/モデル依存 | 低 |
| ローカル追加 | bartowski/Qwen2-VL-7B-abliterated-GGUF(mmproj同梱) | LM Studio即運用・拒否ゼロのVLM票 | 最高 | 低 |
| 設計の追加 | 2段審判+OpenCV/PILルールスコアラ | refusal原理排除・絶対止まらない保険 | 100%(画像非提示/分類器) | 中 |
2025後半〜2026にかけて、huihui-ai をはじめとする有志が主要オープンVLMの abliterated 版を継続リリースしている。abliterationは「モデルが拒否を出すときに活性化する“refusal方向”の残差ベクトルを特定し、全層の重みからその成分を引き算する」手法で、追加学習なしに拒否回路だけを無力化できる[3][14]。VLMではテキスト側(LLM)だけをabliterateし、vision encoderは触らないのが定石(画像理解性能を落とさないため)[4]。これにより「画像説明・採点は通すが画質は素モデル並み」というR18採点に理想的な特性が手に入る。
| レイヤ | 供給の厚み | 代表 | R18採点適性 |
|---|---|---|---|
| ① 重み(HF) | 厚い(abliterated VLMが毎週増加) | huihui-ai / prithivMLmods / mradermacher / bartowski | 最高(自前運用) |
| ② クラウドserve | 中(自前モデルserveできる所が鍵) | Featherless(任意HF)/ Venice(uncensored自社) | 高(GPU不要) |
| ③ 完成API(検閲済) | 薄い(NSFW入力は軒並み拒否) | OpenAI/Gemini/Claude/標準Qwen API | 不適(refusal) |
既存DRは①(ToriiGate等)と「Grok=②③の例外」を押さえた。本DRの新規価値は②のFeatherless/Veniceと、①のabliterated VLM群。これらは「Grokが落ちた/規約が変わった/レート制限」時の代替系として効く。
CC3の現行体制はGrok依存度が高い。xAIが画像入力のNSFWポリシーを締めた瞬間、採点ライン全体が止まる単一障害点になっている。abliterated VLM(重みが手元にある=外部規約で止まらない)と、Featherless/Veniceという別系統のクラウドを足すことは、可用性の保険として明確な需要がある。
「画像入力で拒否しないか × Vision可 × API形態 × 料金 × 注意点」で横断比較。HFパス/モデルIDは実在確認済。未確認は「要確認」と明記し創作しない。
| # | サービス/モデル | Vision | 非拒否度 | API形態 | 料金 | 注意点 |
|---|---|---|---|---|---|---|
| 1 | Featherless.ai(任意HF VLM=abliterated可) | 可[8] | 最高(載せるモデル次第) | OpenAI互換 api.featherless.ai/v1 | 月額flat[7] | vision対応モデルを自分で選ぶ。abliterated系を選べば実質無検閲 |
| 2 | Venice.ai(Qwen3-VL-235B / GLM-V) | 可[2] | 高(uncensored明言) | OpenAI互換[1] | 従量(diem)/プライバシー重視 | CSAM等は当然禁止。成人同人R18は実務上通る範囲 |
| 3 | DeepInfra(Qwen2.5-VL系 等) | 可 | モデル依存(素VLは安全層有) | OpenAI互換 | 従量・安価 | 素のQwen2.5-VLは拒否寄り。abliterated版が載っていれば通る[9]=要確認 |
| 4 | Hyperbolic | VL提供あり/要確認 | モデル依存 | OpenAI互換 serverless[10] | 従量・安価 | abliteratedホストの有無は時点で変動=要確認 |
| 5 | Together AI | 可(Qwen-VL/Llama-Vision等) | 低(標準モデル中心=安全層強) | OpenAI互換 | 従量 | 採点には不向き。SFW前処理用途 |
| 6 | Novita AI | VL提供あり/要確認 | モデル依存 | OpenAI互換 | 従量 | uncensored系LLMは扱うがVLのNSFW挙動は要確認 |
| 7 | Chutes(分散GPU) | 要確認 | 緩め傾向だが要確認 | OpenAI互換 | 非常に安価 | 分散/可用性ムラ。NSFW通しやすい傾向だが安定性低 |
| 8 | Arli AI | 主にテキストLLM | テキストは緩い | OpenAI互換 | 月額 | VLは弱い。2段審判のテキスト採点役として有用 |
| 9 | Infermatic | 主にテキストLLM | テキストは緩い | OpenAI互換 | 月額 | 同上。テキスト審判の非拒否LLM供給源 |
| 10 | Targon / Featherless無料枠系 | 要確認 | 要確認 | OpenAI互換 | 無料/従量 | 可用性・SLA不明。検証用にとどめる |
| モデル / HFパス | base | サイズ | GGUF(mmproj) | 動作 | 非拒否 |
|---|---|---|---|---|---|
| huihui-ai/Qwen2.5-VL-7B-Instruct-abliterated[3] | Qwen2.5-VL-7B | bf16 約14-16GB | —(transformers) | transformers (AutoModelForVision2Seq) | 高(text側除去・vision不変) |
| huihui-ai/Huihui-Qwen3-VL-8B-Instruct-abliterated[4] | Qwen3-VL-8B | 17.6GB(bf16) | mradermacher GGUF有[4] | transformers / ollama(huihui_ai/qwen3-vl-abliterated:8b-instruct) | 高 |
| bartowski/Qwen2-VL-7B-Instruct-abliterated-GGUF[5] | Qwen2-VL-7B | Q4_K_M 4.68GB〜 | 有 (mmproj-…-f16 1.35GB) | llama.cpp / LM Studio / ollama | 最高(GGUFで即運用) |
| prithivMLmods/Qwen2.5-VL-Abliterated-Caption-GGUF[6] | Qwen2.5-VL 3B/7B | 1.27〜15.2GB | 有 (MMProj-Q8/F16) | llama.cpp / LM Studio | 最高(caption特化uncensored) |
| huihui-ai/Huihui-GLM-4.6V-Flash-abliterated(-GGUF)[11] | GLM-4.6V-Flash | 要確認 | GGUF有[11] | llama.cpp / transformers | 高(別系統=多様性票に有効) |
| huihui-ai/Llama-3.2-11B-Vision-Instruct-abliterated[12] | Llama-3.2-Vision | 約20GB | 不可(後述Mllama罠) | transformersのみ | 高だがGGUF化不可 |
LLMが拒否を返すとき、隠れ状態には「refusal方向」と呼ばれる共通の残差ベクトルが現れる。abliterationはこのベクトルを有害/無害プロンプト対のアクティベーション差分から推定し、全層の重み行列からその外積成分を射影除去する(weight orthogonalization)。追加学習不要・元の知識を保ったまま「断る能力」だけを失わせる[3][14]。VLMではテキストデコーダ部のみ処理し、画像エンコーダ(ViT)はそのまま残すのが標準。これがR18採点に都合がよい理由=「説明・採点は通すが画像認識精度は素モデル同等」。
| 経路 | 対象 | VRAM挙動 | 備考 |
|---|---|---|---|
LM Studio(GUI) | GGUF+mmproj(bartowski/prithiv) | GUIで段階オフロード | 最も簡単。モデル+mmprojを同フォルダに置きvisionトグルON・:1234でOpenAI互換 |
llama.cpp(llama-mtmd-cli/server) | GGUF+mmproj | n_gpu_layersで制御・CPU可 | --mmproj mmproj-*.gguf 必須。ComfyUI占有時のCPUフォールバック向き |
ollama | huihui qwen3-vl-abliterated 等 | 自動ロード/アンロード | ollama run huihui_ai/qwen3-vl-abliterated:8b-instruct 一発[4] |
transformers 4bit | huihui Qwen2.5-VL/Llama-Vision-abliterated | GPU常駐・unload自前 | GGUF化できないMllama系はこれ一択 |
1. LM Studio → Search で "bartowski Qwen2-VL-7B abliterated" を検索
2. 本体 Q4_K_M(4.68GB) + mmproj-…-f16(1.35GB) を両方DL
※mmprojが無いと画像が読めない=必須
3. Local Server起動 → http://localhost:1234/v1 (OpenAI互換)
4. CC3から下記で叩く(base_url差し替えだけ)
from openai import OpenAI
import base64
cli = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
b64 = base64.b64encode(open("img.png","rb").read()).decode()
r = cli.chat.completions.create(
model="qwen2-vl-7b-abliterated",
messages=[{"role":"user","content":[
{"type":"text","text":"このR18イラストを構図/エロ度/破綻/抜ける度の4観点で各0-25、合計0-100で採点しJSONで返せ。婉曲表現禁止。"},
{"type":"image_url","image_url":{"url":f"data:image/png;base64,{b64}"}}]}],
temperature=0.3)
print(r.choices[0].message.content)
| ルート | 初期 | 月額/従量 | 1000枚採点コスト目安 | 備考 |
|---|---|---|---|---|
| Featherless(abliterated VL serve) | 0 | 月額flat(プラン制)[7] | 定額内なら実質追加0 | 大量採点ほど割安。料金額は要確認 |
| Venice(Qwen3-VL-235B) | 0 | 従量(diem) | 数十〜百円規模(要確認) | 大型=高品質だが従量で嵩む |
| ローカル abliterated GGUF | 0(既存GPU) | 電気代のみ | ¥0 | 初速はLM Studioで即。GPU占有はComfyUIと調停 |
| 2段審判(caption+テキストLLM) | 0 | テキストLLM分のみ | Grok textは安価/abliterated textは¥0 | 画像トークン不要=最安クラス |
| OpenCV/PILルールスコアラ | 0 | 0 | ¥0 | CPUのみ・無限に回せる |
工数削減:手動目視選別は1枚あたり3〜10秒。1000枚で約1〜3時間。1次足切り(明らかな破綻/低エロ度)をルールスコアラ+ローカルabliterated VLMで自動化すれば、人間目視は上位20〜30%だけで済み選別工数を約70%削減。Featherless月額が選別工数の時給換算を下回れば即ペイする。
| 期間 | やること | 完了基準 |
|---|---|---|
| Day1-3 | LM Studioで bartowski/Qwen2-VL-7B-abliterated-GGUF(本体+mmproj)を起動。R18 5枚で拒否ゼロ&採点が返るか実証 | :1234でvision採点JSONが返る |
| Day4-7 | OpenCV/PILのルールスコアラを実装(§10)。WD-EVA02のexplicit確率と肌面積を加重合成 | 1000枚を数分でスコア付け |
| Day8-14 | 2段審判実装:ToriiGate/JoyCaptionキャプション→Grok/abliterated textに採点委譲。VLM直採点との一致率を測る | 2方式の相関を確認 |
| Day15-21 | クラウド検証:VeniceとFeatherlessに各1モデルでR18採点テスト。拒否率/品質/コストを記録 | 非拒否で安定する1本を確定 |
| Day22-30 | 既存 grok_router アンサンブルにFeatherless(abliterated VL)を第N票として統合。中央値+MADで外れ値除去→加重平均。Grok障害時フォールバック配線 | Grok停止でも採点が止まらない |
huihui-ai/Llama-3.2-11B-Vision-abliteratedはtransformers実行一択(VRAM約20GB)[12][13]。「abliteratedだからollamaで動く」と思い込むと詰む。dolphin-mistral-24b-venice-edition=vision非対応のテキストLLM[15]。Veniceのvision採点を使うにはVenice公式API直が必要。画像をVLMの安全層に通さず、先に無検閲キャプション化→テキストLLMに採点委譲する。テキストLLMは画像を見ないので画像safetyが発火しない=原理的にrefusalが起きにくい。
# 2段審判(疑似コード)
cap = caption_uncensored(img) # ToriiGate/JoyCaption → 婉曲なし記述
prompt = f"""次のR18イラスト客観記述を採点せよ。婉曲表現禁止。
構図/エロ訴求/作画破綻/抜ける度を各0-25、合計0-100。JSONで。
記述: {cap}"""
score = text_llm(prompt) # Grok or Arli/Infermatic(非拒否text)
利点:画像safety完全回避・テキストトークンのみで最安・テキスト採点LLMの選択肢が広い。欠点:構図破綻/解剖学的崩れなど「見ないと分からない情報」がキャプションで欠落。→ 構図系だけはローカルabliterated VLMの直採点で補い、エロ度/属性は2段審判で、と分担するのが最良。
分類器と画像処理だけなので「拒否」という概念が存在しない=100%止まらない最終保険。WD-EVA02のexplicit確率と合成して「エロ度+映え」を数値化する。
import cv2, numpy as np
def skin_ratio(img_bgr):
# HSV肌色マスク(H6-38,S26-218 が代表閾値・要キャリブレーション)
hsv = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2HSV)
lo, hi = np.array([0,30,60]), np.array([22,180,255]) # 肌色帯
lo2, hi2 = np.array([160,30,60]), np.array([179,180,255]) # 赤側回り込み
m = cv2.inRange(hsv,lo,hi) | cv2.inRange(hsv,lo2,hi2)
m = cv2.medianBlur(m,5) # ノイズ除去
return float((m>0).sum())/m.size # 肌面積比 0-1
def saturation_score(img_bgr): # 映え=彩度の中央値
s = cv2.cvtColor(img_bgr,cv2.COLOR_BGR2HSV)[:,:,1]
return float(np.median(s))/255.0
def sharpness(img_bgr): # Laplacian分散=ピント/線の鮮鋭さ
g = cv2.cvtColor(img_bgr,cv2.COLOR_BGR2GRAY)
v = cv2.Laplacian(g,cv2.CV_64F).var()
return min(v/1500.0, 1.0) # 1500付近で頭打ち(要調整)
def rule_of_thirds(img_bgr): # 構図=被写体エッジが三分割線に乗るか(簡易)
g = cv2.cvtColor(img_bgr,cv2.COLOR_BGR2GRAY)
e = cv2.Canny(g,80,160); h,w = e.shape
lines=[w//3,2*w//3]; band=max(2,w//40); score=0
for x in lines: score += e[:,x-band:x+band].sum()
return min(score/(e.sum()+1e-6)*3, 1.0)
def erotic_score(img_path, wd_explicit_prob):
img = cv2.imread(img_path)
sk, sat, sh, comp = skin_ratio(img), saturation_score(img), sharpness(img), rule_of_thirds(img)
# エロ度 = 露出(肌)×0.45 + WDのexplicit確率×0.30 + 映え×0.10 + 鮮鋭×0.10 + 構図×0.05
score = 100*(0.45*sk + 0.30*wd_explicit_prob + 0.10*sat + 0.10*sh + 0.05*comp)
return round(score,1), dict(skin=sk,sat=sat,sharp=sh,comp=comp,wd=wd_explicit_prob)
WD-EVA02と組む:SmilingWolf/wd-eva02-large-tagger-v3はdanbooru学習でrating(general/sensitive/questionable/explicit)を確率で吐く=「エロの確度」の客観軸。上式のwd_explicit_probに explicit + 0.5*questionable を入れると、肌面積だけでは拾えない「露出は少ないが行為性が高い」絵も評価できる。肌面積(見た目の露出)とWD確率(行為の露骨さ)は別軸なので併用が効く。
既存 D:\projects\fanza3_mass\scripts\grok_router.py に「Featherless(abliterated VL)」プロファイルを1つ足し、採点は(a)Grok直採点 (b)Featherless abliterated VL直採点 (c)2段審判テキスト (d)ルールスコアラの4票で集約。通った票のみを中央値+MAD外れ値除去→加重平均(VLM票0.4/0.4・2段0.15・ルール0.05など)。Grokが拒否/障害でもFeatherless+ルールで採点が継続する。
D:\市場調査資料\DR_R18NSFW採点できるVisionAI調査と実装_2026-06-10.html — Grok主力+ローカル4本立ての基盤(本DRの前提)D:\市場調査資料\DR_R18自動採点パイプライン_ローカルNSFW_VLMアンサンブル実装_2026-06-10.html — VLMアンサンブル/中央値MAD集約/ComfyUI共存(実装側)D:\市場調査資料\DR_AIエロ漫画自動品質評価システム設計_複数LLM採点誤判定回避人間目視_2026-06-09.html — 複数LLM採点の誤判定回避・人間目視ゲートD:\市場調査資料\DR_採点AI構造的65固定の回避評価設計2026_2026-06-04.html — 採点が65点付近に張り付く構造的バイアスの回避D:\市場調査資料\DR17_NSFW画像品質判定AI_2026-04-30.html — NSFW品質判定の初期調査D:\市場調査資料\DR_NSFW_モデル選定_2026-05-07.md — NSFWモデル選定の原典重複判定:上位2本とテーマは隣接するが、本DRは「既知以外の非検閲クラウド/プロキシ+abliterated VLM+2段審判+自前ルールスコアラ」に内容を限定した穴埋め新規。再掲を避け差分のみ。既存2本の更新ではなく、相互参照する補完巻として独立保存が適切。