先に結論
OpenAI API の pricing 更新で大きいのは、モデル、音声、検索、Containers の原価前提が同じページで読めるようになったことです。
まず見直すべきなのは次の 4 つです。
- 通常推論を GPT-5.5 に寄せるのか、GPT-5.4 に落とすのか
- 常用タスクや subagent を GPT-5.4 mini へ逃がせるか
- Realtime Translate と Whisper を分単価で引き直すか
- Containers を開きっぱなし前提で使っていないか
特に Realtime と agent 実行を入れているチームは、トークン単価だけの見積もりではもう足りません。
何が変わったか
OpenAI の pricing page では、flagship models として GPT-5.5、GPT-5.4、GPT-5.4 mini が並び、それぞれの input、cached input、output 単価が明示されました。
2026-05-21 時点で確認できる単価は次の通りです。
| モデル | 入力 | キャッシュ入力 | 出力 |
|---|---|---|---|
| GPT-5.5 | $5.00 / 1M tokens | $0.50 / 1M tokens | $30.00 / 1M tokens |
| GPT-5.4 | $2.50 / 1M tokens | $0.25 / 1M tokens | $15.00 / 1M tokens |
| GPT-5.4 mini | $0.75 / 1M tokens | $0.075 / 1M tokens | $4.50 / 1M tokens |
差が分かりやすいので、重い仕事を GPT-5.5 に集め、常用は GPT-5.4 か mini で受ける設計を考えやすくなりました。
同じページで、Realtime 系も読みやすくなっています。
- GPT-Realtime-Translate: $0.034 / 分
- GPT-Realtime-Whisper: $0.017 / 分
- Web search: $10 / 1,000 calls
- Containers: 現在は container 単位、2026-03-31 からは 20 分 session per container 単位
つまり今回の更新は、単なるモデル価格表ではありません。voice、search、execution まで含めた実務の見積もり表 に近づきました。
どのチームが先に引き直すべきか
一番影響が大きいのは、OpenAI API をすでに本番に入れているチームです。
coding や業務自動化を回しているチーム
GPT-5.5 は coding と professional work 向けに強い位置づけですが、出力単価は GPT-5.4 の 2 倍です。
コード生成、レビュー、長文要約を全部 GPT-5.5 に寄せると、効果が出る前に原価が先に重くなる場面があります。
日常の修正、軽い調査、subagent の並列処理は GPT-5.4 mini に落とし、難しい部分だけ GPT-5.5 に上げるほうが現実的です。
OpenAI ベースで agent 実装を考えているなら、OpenAI Agents SDK sandbox provider 比較 も合わせて見ると、モデル単価と execution cost を分けて考えやすくなります。
voice agent や通訳を回しているチーム
Realtime Translate と Realtime Whisper は、分単価で見積もれるようになったのが大きいです。
たとえば通訳は 10 分で 0.34 ドル、Whisper は 10 分で 0.17 ドルです。ざっくりでも通話時間に掛ければ、PoC の時点で原価感が出ます。
Realtime 音声の比較や代替候補まで見たい場合は、Gemini 3.1 Flash Live vs OpenAI Realtime API vs LiveKit Agents も役に立ちます。
browser automation や sandbox 実行を回しているチーム
Containers は見落としやすいですが、agent 実装ではかなり重要です。
OpenAI は現在の container 単位課金に加え、2026-03-31 から 20 分 session per container での表記へ変わる案内を出しています。
長時間ぶら下げる browser task、code execution、検証用 sandbox は、何回開くか と どれだけ開きっぱなしにするか を分けて見る必要があります。
まず見るべき 4 つの原価ポイント
1. GPT-5.5 を標準にしない
GPT-5.5 は強いですが、標準モデルに据える前に仕事を分けたほうが安全です。
複雑な設計、難しいデバッグ、長い reasoning だけ GPT-5.5 に寄せ、通常は GPT-5.4 か mini を使うだけで月額差はかなり変わります。
2. mini を subagent の標準候補に入れる
GPT-5.4 mini は coding、computer use、subagents 向けと案内されています。
小さな調査、前処理、分類、下書きのような常用タスクを mini に寄せると、並列数を増やしても原価が暴れにくくなります。
3. Realtime は token ではなく分で置く
音声系は token ベースで細かく読むより、まず分単価で荒く引くほうが早いです。
通話件数、平均通話時間、同時接続数を置けば、PoC を続けるべきかの判断がかなり早くなります。
4. Containers は session 設計から見直す
Containers の変更予定を見ると、これからは単価より session 設計のほうが効きます。
1 回の task を短く閉じるのか、長めの作業を 1 つの実行環境でまとめるのかで、agent 運用の原価はかなり変わります。
OpenAI API を使い続けるべきか
今回の pricing 更新だけを見るなら、OpenAI API はまだかなり扱いやすいです。
理由は、モデル料金だけでなく、Realtime、Web search、Containers まで同じ場所で確認できるからです。
一方で、予算統制まで同時に考えるなら、料金表の見やすさだけでは足りません。project 単位の上限や cost reporting まで含めて比較したい場合は、Gemini API spend caps vs OpenAI usage tiers vs Anthropic usage reports【2026年版】AI API のコスト事故を防ぎやすいのはどこか も合わせて確認したほうが安全です。
今すぐやること
最後に、2026-05-21 時点でやる価値が高い順に並べるとこうです。
- 既存ワークロードを GPT-5.5、GPT-5.4、mini のどれで回しているか棚卸しする
- Realtime の利用量を分単位で引き直す
- Web search の call 数と Containers の開き方を確認する
- 高単価タスクだけ上位モデルへ寄せる routing を決める
今回の pricing 更新は、派手な新機能の話ではありません。
でも、原価の前提がずれたまま agent や音声を広げるほうがずっと危ないです。OpenAI API を使っているなら、今が一度見積もりを引き直すタイミングです。