Claude Opus 4.8 発表(2026-05-28)— 価格据え置きで Super-Agent を完走、Online-Mind2Web 84%、effort 制御と dynamic workflows

Anthropic が 2026-05-28 に Claude Opus 4.8(API 名 claude-opus-4-8)を公開しました。Opus 4.7 を土台に、ベンチマーク横断で精度を上げつつ、価格は据え置きという構成です。同日に Claude Code も v2.1.154 で Opus 4.8 を標準化しています(その周辺の changelog は Claude Code v2.1.152〜v2.1.168 まとめを参照)。

この記事では、「何に使える発表なのか」という観点で、価格・ベンチマーク・新機能を整理します。前世代の挙動変化が気になる場合は Opus 4.7 の breaking changes 解説も合わせてどうぞ。

価格は据え置き($5 / $25)

まず実務でいちばん効くのが、価格が Opus 4.7 から変わっていないことです。

項目	通常	fast mode
入力(100 万トークン)	$5	$10
出力(100 万トークン)	$25	$50

fast mode(2.5 倍速)は通常レートの 2 倍($10 / $50)。これは従来モデルの fast mode より約 3 分の 1 の価格で、速度を買うコストが大きく下がりました。なお Opus 4.8 の fast mode は現状 Claude API のみの research previewで、Claude Code では Max プランが既定で使用します。
prompt cache(キャッシュヒット時に大幅割引)や Batch API(非同期処理で割引)はこれまでどおり併用できます。キャッシュの仕組みは Claude API の prompt caching を参照。

何に使えるか: 精度を上げるために単価が上がる、という乗り換えコストが無いので、既存の Opus 4.7 ワークロードはそのまま 4.8 へ差し替えられます。レイテンシが要る用途は fast mode(上記の提供条件に注意)、夜間バッチは Batch API、と出し分ければコストは従来比で下げられます。

ベンチマーク:エージェント系で頭一つ抜けた

Opus 4.8 は、長時間・複数ステップのエージェント実行で特に伸びています。

Super-Agent: 全ケースをエンドツーエンドで完走した唯一のモデル。旧 Opus と GPT-5.5 を上回ったとされます。
Legal Agent Benchmark: 記録上の最高スコア。「all-pass」基準で全体 10% を初めて突破した最初のモデル。
Online-Mind2Web(コンピュータ操作・ブラウザエージェント): 84%。Opus 4.7 と GPT-5.5 の双方からの有意な向上とされます。
CursorBench: すべての effort レベルで旧 Opus を上回る。

何に使えるか: 数字の主役は**「最後まで自走するエージェント」**です。途中で迷子になりやすかった多段タスク(リサーチ→操作→検証→まとめ)や、ブラウザ/コンピュータ操作を伴う自動化で、完走率の底上げが見込めます。法務系の文書エージェントのように厳密さが要る領域でも伸びています。

ベンチマーク数値は実タスクの保証ではありません。自分のワークロードでの A/B(完走率・やり直し回数・総トークン)で確かめるのが堅実です。

新機能 1:effort 制御

Opus 4.8 は、Claude にどれだけ「effort(労力)」をかけさせるかをユーザーが選べるようになりました。高い設定ほど深い思考に振ります。

Claude Code 側では、これが既定 high effort と /effort xhigh(最難タスク向け)として露出しています。

何に使えるか: 「難所だけ思考量を上げ、日常の往復は速度優先」という出し入れが 1 つのモデルでできます。コストとレイテンシは effort と速度モードのかけ合わせで決まるので、用途ごとに段を選ぶ運用が前提になります。

新機能 2:dynamic workflows(Claude Code の research preview)

Opus 4.8 の発表に合わせて、Claude Code に dynamic workflows が入りました。1 セッションで数百の並列サブエージェントを走らせるもので、Enterprise / Team / Max プランの Claude Code に研究プレビューとして提供されます。

何に使えるか: 「1 本の会話に収まらない規模」——コードベース横断の監査、大規模リファクタ、移行作業のように分割→並列→検証→統合を要する仕事を、1 コマンドにまとめられます。Claude Code 上でのトリガー語や /workflows の使い方はまとめ記事側で扱っています(トリガー語は後日 ultracode に改名)。

新機能 3:Messages API が mid-task の system 注入を受け付ける

API 利用者に効くのが、Messages API が「タスクの途中」で system エントリを受け付けるようになり、しかも prompt cache を壊さない点です。

何に使えるか: 長時間エージェントの実行中に、方針・制約・ツールの追加情報を system として差し込むことが、キャッシュを再構築せずにできます。これまで mid-task の指示注入はキャッシュミスを誘発しがちでしたが、そのコスト・レイテンシのペナルティを避けて動的にガードレールを足せます。キャッシュが外れた原因の特定には cache diagnostics も使えます。

提供形態

発表当日から全プラットフォームで利用可能です。

claude.ai(Web / アプリ)
Claude API(claude-opus-4-8)
Claude Code(v2.1.154 で Opus 4.8 を標準化)

アラインメント評価

Anthropic のアラインメントチームは、Opus 4.8 が向社会的(prosocial)な特性の指標で新たな高水準に達し、ミスアラインメント挙動の発生率が Opus 4.7 より大幅に低いと報告しています。エージェントに長時間・広い権限を与える用途ほど、この安定性は実務的に効きます。

推奨アクション

Opus 4.7 を使っている人: 価格据え置きなので、まず claude-opus-4-8 へ差し替えて自分のワークロードで A/B(完走率・やり直し・総トークン)を取る
低レイテンシ用途: fast mode(Claude API の research preview / Claude Code は Max が既定。2 倍レートで 2.5 倍速、従来比で約 1/3 の価格)を検討
長時間エージェント / API 直叩き: effort を用途ごとに段で選び、mid-task の system 注入でキャッシュを壊さずガードレールを足す
Claude Code ユーザー: 既定 high effort と /effort xhigh を使い分ける。dynamic workflows は研究プレビューとして大規模タスクに試す

まとめ

Claude Opus 4.8 は、価格を据え置いたままエージェント系の完走率を底上げしたアップデートです。Super-Agent のエンドツーエンド完走、Online-Mind2Web 84%、Legal Agent Benchmark の最高スコアと、伸びは「最後まで自走する」方向に集中しています。effort 制御・dynamic workflows・mid-task system 注入という、長時間タスクを安定して回すための足回りが揃ったのが今回の核心です。乗り換えコストが無いので、既存 Opus ワークロードはまず差し替えて実測するのが正解です。

release notes / model release タグで Anthropic のモデル・プラットフォーム情報を継続フォローしています。