Code with Claude 2026 発表まとめ(2026-05-06)— Managed Agents の新機能 3 つ、SpaceX 提携で rate limit 倍化、Claude Code に Code Review / Routines 等を追加

Anthropic の開発者カンファレンス Code with Claude 2026 が 2026-05-06 に San Francisco で開催されました(続いて London 5-19、Tokyo 6-10)。新モデルの発表は無しでしたが、既存モデル(Opus 4.7 / Sonnet 4.6 / Haiku 4.5)の上に積む**「現場の 10 倍化」のための一式が一気に出ました。本記事では keynote の発表を開発者として何を触り、何を考え直すべきか**という観点で整理します。

全体像 — 4 本柱で読む

発表は大きく 4 つの軸で読むとスッキリします。

軸	何が出たか	誰に効くか
インフラ	SpaceX Colossus 1 提携、Claude Code 5h 制限の倍化	重い使い方をしているチーム全員
Managed Agents	Multi-agent orchestration、Outcomes、Dreaming	プロダクトに Agent を組み込む層
Claude Code	Code Review、Remote Agents、CI auto-fix、Security Reviews、Routines	日常的に Claude Code を使う開発者
API	Task Budgets(public beta)、Advisor Tool(beta)	API を直接叩いてエージェント基盤を作る層

報じられた数字としては API 利用量が前年比 17 倍、Mercado Libre が「2026 Q3 までに コーディングの 90% を自律化」を目標にしている、といった事例が紹介されました。エージェントの本気度は Anthropic 自身の自慢ではなく、ユーザー側のロードマップが先に立っている段階に来ています。

1. インフラ — SpaceX Colossus 1 と rate limit 倍化

Colossus 1 の取り込み

SpaceX が Memphis(Tennessee)で運用するデータセンター Colossus 1 のキャパシティ全量(報道では 300MW 超)を Anthropic が利用できる契約が成立しました。Bloomberg / Axios が同日報じています。

Claude Code の 5 時間制限が 2 倍

これは現場で一番効きます。これまで Pro / Max / Enterprise に課されていた 5 時間ウィンドウの usage limit が 2 倍 になりました。2026-05-06 適用。重いリポでの大型タスクや、複数の worktree を並列で走らせている運用が、5 時間の壁に当たって止まる頻度が下がります。

確認手順: アカウントポータルの利用状況グラフを開き、5/06 以降の上限線が従来の 2 倍で引かれていることを確認できます。確認できなければサポートに照会。

Claude API 側の rate limit

keynote では Claude API 側の rate limit についても開発者全般に対する増枠が言及されました。具体値は dashboard で各アカウント差があります。今までスロットリングを理由に避けていたユースケース(並列推論、長時間バッチ)を再評価する好機です。

2. Managed Agents — 新機能が 3 つ追加

既出記事で扱った Managed Agents に、3 つの大きな新機能が追加されました(うち 2 つは public beta、1 つは research preview)。

Multi-agent orchestration

1 つのタスクに対して、複数の agent を編成して投入するという枠組みです。これまで Claude Code 内でユーザーが Agent ツールを呼んで作っていた「並列サブエージェント」を、Managed Agents 側のサーバインフラ上で再現できるようになりました。

開発者目線での意味:

親 agent が plan → 子 agent 群に独立したコンテキストで作業を委任 → 結果を回収する流れを、サーバ側で完結させられる
それぞれの agent の context window を別にできるため、「親のコンテキスト枯渇」を引き起こさない
セッション ID が parent / child で紐づくため、監査ログがツリー状に取れる

Outcomes(public beta)

Agent に**「成功とは何か」を宣言的に与える**仕組みです。従来「タスクを実行して」だったものが、「この成功条件を満たすまで自分で iterate して」になります。

# イメージ
outcome:
  description: "全 unit test が green、E2E smoke は 30 秒以内"
  signals:
    - type: command
      cmd: "bun run test"
      expect_exit_code: 0
    - type: command
      cmd: "bun run e2e:smoke --timeout 30000"
      expect_exit_code: 0

この宣言を渡すと、agent は失敗時に自分で修正→再実行のループを回します。人間が介在せず収束させるための公式パターンです。

Dreaming(research preview)

名前が刺さりやすいですが、中身は地に足が付いた機能です。過去セッションを agent が自己点検し、何を見落としたか・どこで非効率だったかを抽出して self-improve に回す仕組み。研究プレビュー段階で、現時点では限定提供。

実用面で重要なのは、「あの時はこうすれば良かった」という事後学習を agent 側で取り扱えることです。今までは人間がプロンプトや system prompt に手で反映していた部分が、メタ学習ループに乗ります。

3. Claude Code — keynote で出た新機能

全部 beta 〜早期 GA 段階ですが、いずれも実運用に効きます。

Code Review tool

Claude Code 内蔵の PR / 差分レビュー機能が公式機能化。これまで slash command や ad-hoc な指示で実現していた「自分の差分を別視点で読み直してもらう」を、専用の hook と UI で行えます。/ultrareview と棲み分けつつ、ローカル無料の review 一次フィルタとして日常運用に入ります。

Remote Agents — 携帯から laptop を操作

スマホから自分のローカル開発環境上の Claude Code を呼ぶ運用パターンが公式サポートに。家を出てから「あ、あの修正やり忘れた」と思っても、コミット〜PR 化まで携帯で済ませられるのが現実的になりました。

セキュリティ観点での要点:

接続は Anthropic 側の relay ではなく、ユーザー所有の identity 経由でテザリングされる
ローカル machine 側で claude code remote serve 系のプロセスが必要(つまり機密性の高いリポでは off にできる)
使用にはアカウント認証 + 端末 pairing が必要

CI auto-fix

CI が落ちたら自動で PR を上げる仕組み。GitHub Actions 連携が中心で、**「赤 → Claude が原因解析 → 修正コミットを branch に push → PR を更新」**を全自動で走らせる runner が整備されました。

# .github/workflows/claude-auto-fix.yml(イメージ)
on:
  workflow_run:
    workflows: ["CI"]
    types: [completed]
jobs:
  autofix:
    if: github.event.workflow_run.conclusion == 'failure'
    runs-on: ubuntu-latest
    steps:
      - uses: anthropics/claude-code-autofix@v1
        with:
          mode: "patch"
          max-attempts: 3

CI が落ちる頻度の高いコードベースでは人間の介在を後ろに回すための一手として効きます。ガードレール(max-attempts、disallowed-paths 等)の設計だけは慎重に。

Security Reviews

/security-review が公式 skill として標準同梱に。差分の中で credentials の露出、SQL 文字列結合、認証回避経路、CSRF 抜け、CSP 緩和などをチェックする流れがそのまま手元で走ります。OWASP top 10 ライクな観点をデフォルトで載せたい人に。

Routines — 非同期自動化と PR スケジュール

これは実体としては Anthropic 側の cron / 任意トリガーで Claude Code を呼ぶ runner。「毎日 10:00 に dependency update PR を作る」「特定 webhook でデプロイ前 review を走らせる」といった人間不在での反復タスクを専用に扱う層です。

これまで個人で GitHub Actions に書いていた運用 PR 系の自動化を Anthropic 側のホストで走らせられるため、自前ランナー無しで組めるのが魅力。

4. API — Task Budgets と Advisor Tool

ここはこのブログでも別記事で深掘りしています。keynote ベースの位置付けだけ整理します。

Task Budgets(public beta)

Opus 4.7 専用。output_config.task_budget でエージェントループ全体の token 予算を渡すと、Claude が残量を見ながらペース配分して、予算ギリギリで「今ある成果をまとめて締める」ふるまいを取ります。

beta header: task-budgets-2026-03-13
最低値: 20,000 tokens(以下は 400 で reject)
soft cap(advisory)。max_tokens と組み合わせるのが定石

詳細は Task Budgets 実践ガイドで。

Advisor Tool(beta)

速い executor が、賢い advisor に途中で相談する枠組み。executor は Sonnet 4.6 / Haiku 4.5、advisor は Opus 4.7 という組み合わせが本命で、Sonnet 単独より高品質、Opus 単独より大幅に安価を狙えます。

beta header: advisor-tool-2026-03-01
tool type: advisor_20260301
内部で別 inference を回し、advisor の plan を executor に流し込む

詳細は Advisor Tool 実践で。

5. その他: Finance Agents と Microsoft 365

keynote 前日に発表された Claude for Financial Services(2026-05-05)も、Code with Claude の流れの一部として位置付けられました。10 個の業務 agent テンプレ、Microsoft 365(Excel / PowerPoint / Word)との直結、Moody’s MCP 等を含む 8 つの新コネクタ。詳細は Finance Agents 解説を参照。

どの順で触るのが良いか

個人/少人数チーム:

rate limit 倍化 を体感: 重いタスクをためらわず投げてみる
Claude Code の /security-review、Code Review を CI 前のローカル一次レビューに固定化
Routines で「毎週月曜の依存更新 PR」など反復タスクを 1 件試す
API 直叩きで何かを作っているなら Advisor Tool をまず触る(コスト効率が分かりやすい)

プロダクトに Agent を載せている層:

Outcomes で「収束条件」を契約として書き直す
Multi-agent orchestration で「子 agent に独立コンテキストを切る」設計に書き換え
長時間 loop には Task Budgets を最初から噛ませて総 token 消費の上限を運用契約として固定
Dreaming は研究プレビューだが、self-improve のフックを差せる場所を空けておく

エンタープライズ / プラットフォーム責任者:

rate limit 倍化 を踏まえた新規ユースケースの再評価(従来落としていたもの)
CI auto-fix の運用ガードレール(allowed paths、required reviewers、policy refusal の挙動)を先に固める
Remote Agents は organization 単位で off にできる設計(機密リポでは禁止する運用)を先に整える

まとめ

新モデル発表が無かったぶん、既存モデルの上に積む実運用ツールが一気に揃った回でした。インフラ(SpaceX / rate limit)、Managed Agents の 3 機能、Claude Code の運用機能、API の Task Budgets / Advisor——どれも「人間の手が遅れる場所をエージェント側で吸う」方向に揃っています。

「速く回せばいい」ではなく「自律で収束させる」が今年のテーマです。outcome を宣言する、budget を渡す、advisor に相談させる、failure 時に CI が auto-fix する——keynote の各機能はそのための部品として一貫しています。