Claude Opus 4 / Sonnet 4 が 2026-06-15 に廃止、Opus 4.1 は 08-05 — いま必要な移行手順(breaking changes 込み)

Anthropic 運営プラットフォーム(Claude API / Claude Platform on AWS / Microsoft Foundry)で、claude-opus-4-20250514 と claude-sonnet-4-20250514 が 2026-06-15、claude-opus-4-1-20250805 が 2026-08-05 に廃止されます。廃止後のリクエストは失敗します。Opus 4 / 4.1 から Opus 4.8 への移行は 4.7 世代の breaking changes(extended thinking 廃止・sampling パラメータ拒否・新トークナイザ・prefill 廃止)を伴います。影響範囲の棚卸しと具体的な移行手順をまとめます。

Anthropic 運営のプラットフォーム(Claude API / Claude Platform on AWS / Microsoft Foundry)で、Claude 4 世代の旧モデルが相次いで廃止されます。廃止日を過ぎたリクエストは失敗するため、まだ旧モデル ID を叩いているコードがあるなら、いまが移行のタイミングです。

本記事は本日 2026-06-08 時点の廃止スケジュールと、Opus 4 / 4.1 → Opus 4.8 および Sonnet 4 → Sonnet 4.6 の具体的な移行手順を、breaking changes 込みで整理します。移行先 Opus 4.8 の中身は Claude Opus 4.8 発表 を参照してください。

廃止スケジュール(まず日付)

廃止日廃止モデル ID推奨移行先残り(6/8 時点)
2026-06-15claude-opus-4-20250514claude-opus-4-8約 1 週間
2026-06-15claude-sonnet-4-20250514claude-sonnet-4-6約 1 週間
2026-08-05claude-opus-4-1-20250805claude-opus-4-8約 2 か月
  • 対象は Anthropic 運営プラットフォーム(Claude API / Claude Platform on AWS / Microsoft Foundry)。Amazon Bedrock・Vertex AI は独自の廃止スケジュールを持つため、各プラットフォームのモデル表を確認してください。
  • Anthropic は公開モデルの廃止について最低 60 日前に告知します。Opus 4 / Sonnet 4 は 2026-04-14 告知、Opus 4.1 は 2026-06-05 告知でした。

影響範囲を棚卸しする

「どこで旧モデルを使っているか」を先に確定します。Console の使用状況からエクスポートするのが確実です。

  1. Claude Console の Usage ページを開く
  2. Export で CSV をダウンロード
  3. CSV を API キー別・モデル別に見て、claude-opus-4-20250514 / claude-sonnet-4-20250514 / claude-opus-4-1-20250805 の利用箇所を洗い出す

Claude Managed Agents を使っている場合は、モデル名の更新以外のコード変更は不要です(Messages API 直叩きのコードのみ下記の breaking changes が関係します)。

自動移行:/claude-api migrate

Claude Code を使っているなら、同梱の Claude API スキルで移行を自動化できます。

/claude-api migrate this project to claude-opus-4-8

このスキルは、モデル ID の置換に加えて、必要に応じて breaking なパラメータ変更・prefill の置換・effort の再調整をコードベース全体に適用し、手で確認すべき項目のチェックリストを出します。編集前に対象範囲(作業ディレクトリ全体 / サブディレクトリ / 特定ファイル群)の確認を求めます。Bedrock・Vertex AI・Claude Platform on AWS・Microsoft Foundry のクライアントも検出し、各プラットフォームの ID 形式に合わせます。

手で進める場合は、以下の breaking changes を踏まえてください。

Opus 4 / 4.1 → Opus 4.8 の breaking changes

ここが今回の肝です。Opus 4.7 → 4.8 には breaking change はありませんが、Opus 4 / 4.1 は 4.7 より前の世代なので、4.7 世代で入った breaking changes をまとめて適用する必要があります。thinkingenabled のまま投げる、temperature を付けたまま投げる、といった旧コードは 400 エラーになります。

1. extended thinking の廃止 → adaptive thinking + effort

thinking: {type: "enabled", budget_tokens: N}4.7 以降サポートされず 400 エラーになります。adaptive thinking に切り替え、思考の深さは effort パラメータで制御します。

# Before(Opus 4 / 4.1 系)
client.messages.create(
    model="claude-opus-4-20250514",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "..."}],
)

# After(Opus 4.8)
client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # "max" / "xhigh" / "high" / "medium" / "low"
    messages=[{"role": "user", "content": "..."}],
)

なお adaptive thinking は 既定では無効です(thinking 無指定だと思考なしで動作)。明示的に thinking: {type: "adaptive"} を付けて有効化します。

2. sampling パラメータの拒否

temperature / top_p / top_k非デフォルト値に設定すると 400 エラーになります(4.7 以降、4.8 含む)。リクエストから削除するのが安全です。挙動の誘導はプロンプトで行うのが推奨です。temperature = 0 での決定性に依存していた場合、そもそも従来モデルでも同一出力は保証されていなかった点に注意してください。

3. thinking 表示の既定が omitted

4.7 以降、thinking ブロックは応答に現れますが、thinking フィールドは既定で空です(既定 "omitted")。推論過程をユーザーにストリーミング表示している製品では、出力開始前に長い無音として見えてしまいます。表示を戻すには:

thinking = {"type": "adaptive", "display": "summarized"}

4. 新トークナイザ(トークン数が増える)

4.7 以降は新しいトークナイザを使い、同じテキストで 約 1x〜1.35x(最大 ~35% 増) のトークンを使うことがあります。/v1/messages/count_tokens の返り値も変わります。max_tokens に余裕を持たせ、圧縮トリガーも見直してください。Opus 4.8 は 1M コンテキストが標準価格・追加料金なしで使えます。

5. prefill の廃止(4.6 から継続)

アシスタントメッセージの prefill は 400 エラーになります。代わりに structured outputs・システムプロンプト指示・output_config.format を使ってください。

これらの breaking changes は Opus 4.7 移行時のものと同一です。背景の詳しい解説は Opus 4.7 の breaking changes 解説 にまとめてあります。

Opus 4.8 で「変わるが breaking ではない」点

ID を入れ替えた後に挙動の差として確認しておく項目です。

  • effort の既定が high(全サーフェスで)。コーディング・高自律タスクは xhigh を明示。effort レベルのトークン配分は 4.8 で再調整(medium はやや増、high はやや減、xhigh は大幅増)。4.7 で調整済みなら同じレベルで一度ベースラインを取り直す
  • 1M コンテキストが既定(Claude API / Bedrock / Vertex AI。Microsoft Foundry は 200k)。古いモデル互換で付けていたコンテキスト系 beta ヘッダは削除可
  • mid-conversation system messages:role: "system" を user ターン直後に置けるようになり(配置ルールあり)、指示更新のために履歴を作り直していたコードを簡素化しつつ prompt cache ヒットを保てる
  • refusal の stop_details が公開ドキュメント化(beta ヘッダ不要・opt-out 不可)。拒否ハンドリングの実装は Claude API の refusal ハンドリング実践 を参照
  • prompt caching の最小長が 1,024 トークンに低下(4.7 より低い)。短くてキャッシュできなかったプロンプトもキャッシュ対象に(コード変更不要)

Sonnet 4 → Sonnet 4.6

claude-sonnet-4-20250514 の移行先は claude-sonnet-4-6 です。Sonnet 4.6 は extended thinking に対応し、エージェント検索の性能を上げつつトークン消費を抑える方向のモデルです(なお Sonnet 4.6 の既定 effort も high)。具体的な API 差分は公式の Migration guide を確認し、移行先で必ず自分のワークロードを検証してください。

移行チェックリスト

  • Console の Usage を Export し、旧モデル ID(claude-opus-4-20250514 / claude-sonnet-4-20250514 / claude-opus-4-1-20250805)の利用箇所を洗い出す
  • モデル ID を移行先(claude-opus-4-8 / claude-sonnet-4-6)へ置換(Claude Code なら /claude-api migrate)
  • thinking: {type: "enabled", ...}{type: "adaptive"} + output_config.effort に変更
  • temperature / top_p / top_k をリクエストから削除
  • 推論表示が必要なら thinking.display: "summarized" を設定
  • 新トークナイザ前提で max_tokens と圧縮トリガーに余裕を持たせる
  • prefill を使っていれば structured outputs / system prompt / output_config.format に置換
  • effort を再評価(既定 high、コーディングは xhigh)。同レベルでコスト・レイテンシを取り直す
  • 移行先で自分のワークロードを A/B 検証してから本番切替

まとめ

6/15 の Opus 4 / Sonnet 4 廃止までは約 1 週間、Opus 4.1 は 8/5 です。廃止後のリクエストは失敗するので、まず Console の Usage で利用箇所を棚卸ししてください。Opus 4 / 4.1 は 4.7 より前の世代のため、Opus 4.8 への移行では extended thinking 廃止・sampling パラメータ拒否・新トークナイザ・prefill 廃止という breaking changes を一緒に踏みます。Claude Code の /claude-api migrate で大半は自動化できますが、effort の再調整と本番前の検証だけは手で確認するのが安全です。

release notes タグで Anthropic のモデル・プラットフォーム情報を継続フォローしています。

参考