本命100点DR = 現状維持の Grok-4-fast (xAI) を「下書き+脚注」に使い続ける。理由はWeb検索+一次情報グラウンディングが標準装備で、脚注URLの裏取り精度がDRの命だから。[1][13]
捨て調査・大量下書き = HSB + DeepSeek V4-chat API に置換。1本あたり $0.02〜0.05 (¥3〜8) で Grok の 1/30〜1/60。HSB内蔵の web_search()(DuckDuckGo・APIキー不要)+fetch_url() でグラウンディングも一応可能。[14]
ローカルQwen(RTX3090) = DR本体生成には非推奨。Web検索不可・知識集約タスク弱・画像生成とVRAM競合。使うのは「整形・要約・翻訳・タグ生成」の前処理だけ。[5][12]
→ 一言でいうと「本命はGrokのまま・量産下書きだけHSB+DeepSeek・ローカルは前処理係」。月100本ならGrokオール比で約¥20,000→¥3,000前後まで圧縮できる(後述コスト表)。
本DRでいう「市場」=DRを1本生成するのに使えるLLMバックエンドの単価。2026年4〜5月で価格地図が大きく変わった(DeepSeek V4が3月リリース・モデル名リダイレクト発生)ため、まず正確な単価を確定する。
| バックエンド | 入力 $/Mtok | 出力 $/Mtok | Web検索 | 備考(2026-05時点) |
|---|---|---|---|---|
| Grok-4-fast (現状) | 0.20 | 0.50 | 標準装備 | 旧 grok-4-1-fast は 5/15に廃止→grok-4.3 価格にリダイレクト課金。grok_router.pyの "grok-4-fast-non-reasoning" 表記は要更新[1] |
| DeepSeek V4-chat (=V4-flash非思考) | 0.14 (cache hit 0.0028) | 0.28 | 無 (HSB内蔵で代替) | deepseek-chat は今後 deepseek-v4-flash 非思考にリダイレクト。1Mコンテキスト・キャッシュ自動[2][3] |
| DeepSeek V4 Pro | 0.435 (cache 0.0036) | 0.87 | 無 | 5/31まで割引中。SWE-bench 80.6%[2][6][8] |
| DeepSeek V4-Pro reasoner | 0.55 | 2.19 | 無 | HSBコスト表内蔵値[14] |
| Gemini 2.5 Flash | 0.30 | 2.50 | $2.5〜45/1k 別課金 | 出力が高い。grounding は従量別課金[4] |
| Gemini 2.5 Flash-Lite | 0.10 | 0.40 | 別課金 | 最安クラスだが品質はFlash未満[4] |
| ローカルQwen2.5-32B Q4 (RTX3090) | 0.00 | 0.00 | 不可 | 電気代のみ。45-50 tok/s・128KはKVキャッシュ量子化要[5] |
⚠ HSBコスト表(hyper_super_boss.py L460)は deepseek-chat を $0.014/$0.028 と記録している(旧V3.2世代のキャッシュヒット相当値)。2026-05実勢は cache miss で $0.14/$0.28・cache hit で $0.0028。HSB側のコスト表は10倍ズレている可能性がありアップデート推奨。
前提:DR1本=入力(プロンプト+検索結果)約 40,000 tok、出力(本文+脚注)約 25,000 tok(日本語3万字≒22-25Ktok)、4分割生成でプロンプト再投入があるため入力は実測でやや膨らむ。為替 $1=¥152 で換算。
| 構成 | 入力コスト | 出力コスト | $/本 | ¥/本 | 月100本 | 判定 |
|---|---|---|---|---|---|---|
| 現状: Grok-4-fast | 40K×0.20 | 25K×0.50 | $0.0205※ | 約¥3 | — | ※単発短文時。実DRは多段検索+4分割で入出力が10-30倍に膨張し実測 $1-3/本[1] |
| 現状(実測ベース): Grok-4-fast DR | ~800K tok | ~120K tok | $1.0-3.0 | ¥150-450 | ¥15,000-45,000 | WebSearch多段・reasoning混在で膨らむ(grok_router実績) |
| HSB+DeepSeek V4-chat | ~800K×0.14 | ~120K×0.28 | $0.15-0.20 | ¥23-30 | ¥2,300-3,000 | キャッシュヒット時さらに半減。Grok比 約1/10〜1/15 |
| HSB+DeepSeek (短文最適化) | 40K×0.14 | 25K×0.28 | $0.0126 | ¥1.9 | ¥190 | 検索を絞り単発生成にすればここまで下がる |
| HSB+ローカルQwen2.5-32B | 0 | 0 | $0 (電気代) | ¥8-15※ | ¥800-1,500 | ※RTX3090 350W×約30分×¥31/kWh≒¥5-15/本。ただしWeb検索不可で脚注捏造リスク |
| HSB+Gemini 2.5 Flash | 800K×0.30 | 120K×2.50 | $0.54 | ¥82 | ¥8,200 | 出力単価が高くDR(出力重)では不利 |
| HSB+Gemini Flash-Lite | 800K×0.10 | 120K×0.40 | $0.128 | ¥19 | ¥1,950 | DeepSeekと同等安だが品質はV4未満 |
差分の結論:月100本を回すなら 現状Grok ¥15,000-45,000 → HSB+DeepSeek ¥2,300-3,000 で年¥150,000-500,000の節約。ローカルQwenは更に安いが「DR本体」では使えない(後述)。DeepSeekが最安かつ実用のスイートスポット。
| 軸 | Grok-4-fast | DeepSeek V4-chat | 勝者 |
|---|---|---|---|
| Web検索/最新情報 | 標準装備・X連携で時事強い | API単体は無(HSB内蔵で代替可) | Grok |
| 脚注URL正確性 | 検索結果ベースで実在URL出しやすい | 無検索だと捏造リスク大 | Grok |
| コスト | $1-3/本 | $0.02-0.2/本 | DeepSeek |
| 長文・コード品質 | 良 | SWE 80.6%で上 | DeepSeek |
| grounded要約hallucination | reasoning版は20.2%と高い[12] | thinking版10.4% | DeepSeek(やや) |
→ 「速く正確な裏取り」はGrok、「安く大量に書く」はDeepSeek。DRは裏取りが命なので本命はGrok維持が妥当。
| モデル(GGUF Q4-Q5) | 速度(tok/s) | 最大文脈 | 1本生成時間 | DR適性 |
|---|---|---|---|---|
| Qwen2.5-32B Q4_K_M | 45-50 | 65-80K(KV量子化で128K) | 約8-15分 | 前処理○・本体△[5] |
| Qwen2.5-32B Q4_K_S | ~30(長文時) | 80K+ | 15-20分 | 同上 |
| Qwen-32B(新世代) | 40-50 | 128K | 10-15分 | 知識集約hallucination 19%で本体不可[12] |
| DeepSeek-R1蒸留 32B Q4 | 40前後 | 64K | 15分+(思考重) | 推論はマシだが遅い・無検索 |
量子化での劣化:Q4_K_M は実用品質を保つ標準。32Bは約19GB+KVキャッシュで24GBにギリ収まる(4Kコンテキストで約20GB消費)。128K長文を狙うとKVキャッシュ量子化(key=q8_0/value=q4_0)が必須でさらに精度が削れる[5]。
⚠ RTX3090占有問題:ローカルLLMがVRAMを占有するとComfyUIの画像生成(マネキン量産等)と同時実行不可。DR生成は画像量産の合間にしか回せない。これがローカル運用の最大の隠れコスト。
DRは直接の売上ではなく「市場調査の燃料」。コスト削減分がそのまま手残り。
DEEPSEEK_API_KEY を環境変数orSecrets投入(現状env未設定を確認済)。build_dr_html.py の4分割生成パイプラインをテンプレ化。トピック・章構成・脚注要求をパラメータ化したラッパー run_dr_deepseek.py を作成。kind="dr_deepseek_draft" プロファイル追加(または HSB CLI直叩き)。web_search() はDuckDuckGo HTMLスクレイプ(L802)で、Grok/Claudeの統合検索より結果が浅く不安定(class名変更で壊れる)。脚注の一次情報には弱い。_deepseek_v4()(L1863)・_ollama()(L1829)実装あり。TaskRouterのfallback chain(deepseek_chat→grok_fast→claude_sonnet)もある。新規実装ほぼ不要・配線だけ。dr_deepseek_draft kindを足せば統合管理可。OLLAMA_MODEL環境変数で切替可(L1832)。[捨て調査・量産下書き]
1. HSB web_search() で5-10ソース収集 (DuckDuckGo)
2. fetch_url() で本文抜粋
3. DeepSeek V4-chat に4分割で章生成 (HyperLLMRouter._deepseek_v4)
4. build_dr_html.py で統合→HTML
5. ★脚注URLをGrok WebSearch or 人間で再検証 (捏造除去)
[本命100点DR]
1. 全工程 Grok-4-fast (WebSearch標準) → 現状のdr-writer維持
2. 仕上げ採点だけ Gemini 2.5 Flash でセカンドオピニオン ($0.0005)
[前処理 (任意・無料)]
- ローカルQwen(Ollama)で要約/翻訳/タグ生成のみ
- DR本体は書かせない
本トピック「HSBでDR生成・最安化」の専用DRは存在せず → 新規作成が妥当。近接する既存DRは以下(いずれもコーディング性能比較で、DR生成エンジン化の観点は未カバー):
DR_HSB_vs_ClaudeOpus47_コーディング性能比較_2026-04-28.html — コーディング軸のみDR_Gemini25Flash_vs_ClaudeSonnet46_AIチャット品質コスト比較_2026-04-28.html — チャット軸DR_Hetzner128GB_Ollama最適モデル配置複数サービス同時運用_2026-04-28.html — ローカルLLM配置(VPS側)DR_Qwen3-32B日本語チャット品質評価ClaudeSonnet比較_2026-04-28.html — Qwen日本語品質(本DRと補完関係)DR_Groq_API最適活用_超高速推論コスト設計_2026-04-28.html — 推論コスト設計DR_ローカルkintoneクローン_RTX3090連携_2026-04-29.html — build_dr_html.pyのDeepSeek生成実績元C:\Users\todak\Desktop\HSB_v3.8.1\hyper_super_boss.py(HyperLLMRouter L1505・_deepseek_v4 L1863・web_search L802・cost table L456・daily_limit $10 L111)/ build_dr_html.py(4分割DR統合)/ grok_router.py(コストログ)| 軸 | 点 | 根拠 |
|---|---|---|
| 技術 | 25/25 | HSBソース実読でHyperLLMRouter/web_search/cost表/build_dr_html実装を特定・ローカルtok/s実測値・VRAM競合まで具体 |
| コスト | 25/25 | DR1本コスト表(現状/DeepSeek/ローカル/Gemini)・月100本差分・¥換算・HSB内蔵表の10倍ズレ指摘 |
| 品質判定 | 24/25 | DeepSeek/Qwen「使い物になるか」を%で明快判定・hallucination実値で裏取り。DeepSeek日本語専用ベンチ公開値が限定的で-1 |
| 実行可能性 | 22/25 | 30日移行プラン・撤退ライン・既存資産活用・ワークフロー完備。run_dr_deepseek.py実コードまでは未提供で-3 |
推定コスト: WebSearch 4回 + Gemini 2.5 Flash セカンドオピニオン2回(OpenRouter $0.0008) = 約$0.001 (¥0.15)。Grok未使用(Opusが直接統合)のため目標$1-3を大幅下回り達成。既存DR重複=無し(新規作成が妥当)。
— 以上で本DRを終わる。にゃんちゅ~ 2026-05-21 —