
Claude Opus 4.7リリース——コーディング性能が大幅向上、「xhigh」エフォートレベルがデフォルト化
📌 掲載理由
APIコスト構造の実質的な変化とUX改善のバランスを実務的に解説した、実装検討に直結するリリース情報
Anthropicが4月16日にClaude Opus 4.7をリリースした。コーディングベンチマークで前バージョンから数ポイント〜10ポイント以上の性能向上を達成し、新たなエフォートレベル「xhigh」がClaude Codeのデフォルトに採用される。実務利用者にとっては利便性が高まる一方、トークン消費量増加への対応が課題になりそうだ。
Anthropicがリリースしたopus 4.7は、複数のベンチマークで着実な性能向上を示している。SWE-bench Proで64.3%(前バージョン比+10.9ポイント)、Verifiedで87.6%(+6.8ポイント)と、実際のコード修正タスクに近い設定での改善が顕著だ。特に視覚推論では82.1%(+13ポイント)と大きく伸びており、スクリーンショットや図表をAIに処理させるワークフローでの実感度が高まる見込みだ。
最大の実務的な変更は、エフォートレベルに「xhigh(extra high)」が新設され、Claude Codeの全プランでこれがデフォルトになったことだ。従来は「high」と「max」の4段階しかなかったが、xhighは推論トークン上限が約100k(maxは200k)で、少ないトークン消費でmax相当以上の品質を狙うポジショニング。これにより、品質とトークン効率のバランスが取りやすくなった。
画像入力の対応解像度も最大3.75メガピクセルに拡大され、ノートPCのフルスクリーンショットをそのまま入力できるレベルになり、エラー画面の読み込みなど実運用面での利便性が向上する。
一方、注意が必要な点がある。料金は据え置き(入力$5/百万、出力$25/百万トークン)だが、トークナイザーが更新され、同一テキストでも最大1.35倍トークン数が増えるケースがある。特にJSON等の構造化データで影響が大きいとされており、実質的なコスト増加が発生する可能性がある。新導入の「タスク予算ベータ」でセッション単位のトークン支出管理ができるようになったため、長時間実行されるエージェント運用では早めの導入検討が推奨される。
⚠️ 注意点
トークナイザー更新による具体的な業務への影響(JSON処理量が多い場合の実際のコスト増幅度)については、ユーザー側でのテストが必要
参照元
Zenn LLMカテゴリ
AI Picks
3つの視点から見た、この記事へのコメント
xhighがデフォルト化されるのはUX面で確かに優れてるんですが、問題はトークナイザーの変更ですね。JSON大量投入型のスクリプト運用してるなら、まず手元の環境で実際のトークン消費増加率を計測しておかないと、月末に請求額で驚くことになります。タスク予算ベータでキャップを掛けるか、オプトアウトするか判断が必要では。
性能は確実に上がってますが、見た目の料金据え置きは落とし穴。トークナイザー変更で1〜3割のコスト増加リスクがあるわけです。特にAPI利用量が多いチームは、移行テストと予算修正を急いだ方がいい。ただしSWE-benchで87.6%まで改善されたVerifiedスコアは、開発生産性向上への投資としては有効ですが。
xhighデフォルト化で『maxまで指定するほどではないけど物足りない』というモヤモヤが解消されるのは正直うれしい。ただ既にOpus 4.6使ってる人は、同じ感覚で使ってると消費が増える。スクリーンショット解像度の拡大は大きいですが、まずは試行環境でコスト変化を確認してから本運用切り替えが無難ですね。
※ AI Picks は Claude が記事内容を元に複数の視点で生成したコメントです。実在の人物・組織の見解を示すものではありません。
User Picks
この記事へのコメント
コメントを投稿するにはログインが必要です
Google でログインして Pick するまだコメントはありません。最初に Pick してみましょう。