本文へスキップ
Best AI Service

OpenAI API pricing update 2026|GPT-5.5、Realtime Translate、Containersで今見直すべき原価ポイント

OpenAI API の pricing 更新で、GPT-5.5 / GPT-5.4 / GPT-5.4 mini、Realtime Translate / Whisper、Web search、Containers の見積もり前提がそろいました。何が変わり、誰が先に原価を引き直すべきかを整理します。

公開: 最終確認: 2026年5月21日
最終確認: 2026年5月21日 根拠: 4件の公開情報 確認メモを見る 編集方針
OpenAI API pricing update の原価見直しポイントを整理したイメージ

先に結論

OpenAI API の pricing 更新で大きいのは、モデル、音声、検索、Containers の原価前提が同じページで読めるようになったことです。

まず見直すべきなのは次の 4 つです。

  • 通常推論を GPT-5.5 に寄せるのか、GPT-5.4 に落とすのか
  • 常用タスクや subagent を GPT-5.4 mini へ逃がせるか
  • Realtime Translate と Whisper を分単価で引き直すか
  • Containers を開きっぱなし前提で使っていないか

特に Realtime と agent 実行を入れているチームは、トークン単価だけの見積もりではもう足りません。

何が変わったか

OpenAI の pricing page では、flagship models として GPT-5.5、GPT-5.4、GPT-5.4 mini が並び、それぞれの input、cached input、output 単価が明示されました。

2026-05-21 時点で確認できる単価は次の通りです。

モデル入力キャッシュ入力出力
GPT-5.5$5.00 / 1M tokens$0.50 / 1M tokens$30.00 / 1M tokens
GPT-5.4$2.50 / 1M tokens$0.25 / 1M tokens$15.00 / 1M tokens
GPT-5.4 mini$0.75 / 1M tokens$0.075 / 1M tokens$4.50 / 1M tokens

差が分かりやすいので、重い仕事を GPT-5.5 に集め、常用は GPT-5.4 か mini で受ける設計を考えやすくなりました。

同じページで、Realtime 系も読みやすくなっています。

  • GPT-Realtime-Translate: $0.034 / 分
  • GPT-Realtime-Whisper: $0.017 / 分
  • Web search: $10 / 1,000 calls
  • Containers: 現在は container 単位、2026-03-31 からは 20 分 session per container 単位

つまり今回の更新は、単なるモデル価格表ではありません。voice、search、execution まで含めた実務の見積もり表 に近づきました。

どのチームが先に引き直すべきか

一番影響が大きいのは、OpenAI API をすでに本番に入れているチームです。

coding や業務自動化を回しているチーム

GPT-5.5 は coding と professional work 向けに強い位置づけですが、出力単価は GPT-5.4 の 2 倍です。

コード生成、レビュー、長文要約を全部 GPT-5.5 に寄せると、効果が出る前に原価が先に重くなる場面があります。

日常の修正、軽い調査、subagent の並列処理は GPT-5.4 mini に落とし、難しい部分だけ GPT-5.5 に上げるほうが現実的です。

OpenAI ベースで agent 実装を考えているなら、OpenAI Agents SDK sandbox provider 比較 も合わせて見ると、モデル単価と execution cost を分けて考えやすくなります。

voice agent や通訳を回しているチーム

Realtime Translate と Realtime Whisper は、分単価で見積もれるようになったのが大きいです。

たとえば通訳は 10 分で 0.34 ドル、Whisper は 10 分で 0.17 ドルです。ざっくりでも通話時間に掛ければ、PoC の時点で原価感が出ます。

Realtime 音声の比較や代替候補まで見たい場合は、Gemini 3.1 Flash Live vs OpenAI Realtime API vs LiveKit Agents も役に立ちます。

browser automation や sandbox 実行を回しているチーム

Containers は見落としやすいですが、agent 実装ではかなり重要です。

OpenAI は現在の container 単位課金に加え、2026-03-31 から 20 分 session per container での表記へ変わる案内を出しています。

長時間ぶら下げる browser task、code execution、検証用 sandbox は、何回開くかどれだけ開きっぱなしにするか を分けて見る必要があります。

まず見るべき 4 つの原価ポイント

1. GPT-5.5 を標準にしない

GPT-5.5 は強いですが、標準モデルに据える前に仕事を分けたほうが安全です。

複雑な設計、難しいデバッグ、長い reasoning だけ GPT-5.5 に寄せ、通常は GPT-5.4 か mini を使うだけで月額差はかなり変わります。

2. mini を subagent の標準候補に入れる

GPT-5.4 mini は coding、computer use、subagents 向けと案内されています。

小さな調査、前処理、分類、下書きのような常用タスクを mini に寄せると、並列数を増やしても原価が暴れにくくなります。

3. Realtime は token ではなく分で置く

音声系は token ベースで細かく読むより、まず分単価で荒く引くほうが早いです。

通話件数、平均通話時間、同時接続数を置けば、PoC を続けるべきかの判断がかなり早くなります。

4. Containers は session 設計から見直す

Containers の変更予定を見ると、これからは単価より session 設計のほうが効きます。

1 回の task を短く閉じるのか、長めの作業を 1 つの実行環境でまとめるのかで、agent 運用の原価はかなり変わります。

OpenAI API を使い続けるべきか

今回の pricing 更新だけを見るなら、OpenAI API はまだかなり扱いやすいです。

理由は、モデル料金だけでなく、Realtime、Web search、Containers まで同じ場所で確認できるからです。

一方で、予算統制まで同時に考えるなら、料金表の見やすさだけでは足りません。project 単位の上限や cost reporting まで含めて比較したい場合は、Gemini API spend caps vs OpenAI usage tiers vs Anthropic usage reports【2026年版】AI API のコスト事故を防ぎやすいのはどこか も合わせて確認したほうが安全です。

今すぐやること

最後に、2026-05-21 時点でやる価値が高い順に並べるとこうです。

  1. 既存ワークロードを GPT-5.5、GPT-5.4、mini のどれで回しているか棚卸しする
  2. Realtime の利用量を分単位で引き直す
  3. Web search の call 数と Containers の開き方を確認する
  4. 高単価タスクだけ上位モデルへ寄せる routing を決める

今回の pricing 更新は、派手な新機能の話ではありません。

でも、原価の前提がずれたまま agent や音声を広げるほうがずっと危ないです。OpenAI API を使っているなら、今が一度見積もりを引き直すタイミングです。

最後に確認すること

まずやるべきことは、GPT-5.5 と GPT-5.4 の差額を見ることではなく、自社の利用を 4 つに分けて見積もり直すことです。通常推論、mini 常用、Realtime 音声、Containers 実行を分けるだけで、無駄な高単価運用をかなり減らせます。

向いている人

  • ・OpenAI API のモデル選定と原価試算をまとめて見直したい開発者、PM、技術責任者
  • ・音声通訳、議事録、voice agent で Realtime Translate や Whisper の分単価をすぐ知りたい人
  • ・coding agent、browser automation、sandbox 実行で Containers 課金の前提を確認したいチーム

避けたい人

  • ・API 原価よりモデル性能比較だけを知りたい人
  • ・OpenAI を使う予定がなく、他社 API の比較から始めたい人
  • ・自社のトラフィック量や session 長さを見ずに、表の単価だけで即断したい人

確認メモ

根拠、確認日、まだ扱っていない範囲を本文の後ろにまとめています。

編集方針を見る

確認日

2026年5月21日

確認ソース数

4件

編集責任

@best-ai-service-editorial-review

研究責任 @best-ai-service-research / 編集責任 @best-ai-service-editorial-review

Verification links

まず開く公式リンク

公式発表、Docs、Pricing など、導入判断で先に見るリンクだけを残しています。

official page readduplicate-scope scanrelated-post review

確認した公開情報

  • official pricing page
  • internal editorial comparison

比較観点

  • 単価の読みやすさ
  • Realtime 課金の把握しやすさ
  • tool 課金の追いやすさ
  • 原価試算へ落とし込みやすさ

まだ扱っていないこと

  • • 2026-03-31 以降の Containers 運用細則
  • • individual contract での別料金や volume discount