OpenAI、最新のAIモデル「GPT-5.4」を発表!仕事の効率が劇的に向上

米OpenAI社は、ChatGPTやシステム連携(API)などで利用できる、実務に特化した最新AIモデル「GPT-5.4」をリリースしました。

💡 ニュースの3つのポイント

  • ChatGPTやAPIなどで「GPT-5.4」の提供を開始
  • AIの思考プロセスを事前に見せる「Thinking」機能を追加
  • 細部まで正確に読み取る、高解像度画像の理解力が劇的に向上

🚀 業務を変える「GPT-5.4」の強力な新機能

今回の「GPT-5.4」は、複雑なタスクをいかに効率よく、正確に処理するかに焦点を当てて開発されました。より高度な要求に応える上位版「GPT-5.4 Pro」も同時に提供されます。

1. 思考の計画が見える「Thinking」機能

これまでは答えが出るまでAIの思考がわかりませんでしたが、新機能では回答前に「どう進めるかの計画」を提示します。方向性が違えば途中で軌道修正できるため、何度も指示を出し直す手間が省けます。複雑なウェブ調査など、深く考える必要がある質問でも文脈を見失いません。

2. パソコンを直接操作する「エージェント機能」

AIが自らパソコンを操作し、複数のアプリをまたいだ複雑な作業を実行できるようになりました。一度に読み込める情報量も最大100万単位(トークン)に拡大され、長期的な計画や実行もこなします。また、数あるツールの中から最適なものをAIが自動で選ぶ機能(Tool search)も追加されました。

3. 「もっともらしいウソ」の削減と高画質への対応

AI最大の課題だった事実誤認(ハルシネーション)が大幅に改善され、旧モデル(GPT-5.2)と比べて個別の間違いが33%、回答全体の誤りが18%減少しました。

さらに、画像の読み取り能力も飛躍的に向上しています。

  • 最高画質(original): 最大1,000万画素(または6K解像度)まで画質を落とさず読み込み。
  • 高画質(high): 最大256万画素(または長辺2,048ピクセル)まで対応。 これにより、細かな図面の理解や、パソコン画面上での正確なクリック操作が可能になりました。

📊 データで見る「圧倒的な処理能力」

「GPT-5.4」は少ない情報処理で素早く答えを出す高効率モデルでありながら、あらゆる実務テストで過去のモデルを大きく上回る成績を出しています。

  • 専門知識(GDPval・44職種で評価): 83.0%(旧モデル 71.0%)
  • 投資銀行のアナリスト業務: 87.5%(旧モデル 68.4%)
  • プレゼン資料作成: 約68.0%の人が旧モデルより「デザインや視覚表現が良い」と評価。
  • パソコン操作の成功率(OSWorld-Verified): 75.0%(旧モデル 47.3%)
  • 図表の読み取り成功率(MMMU-Pro): 81.2%(旧モデル 79.5%)
  • 文書解析の誤差(OmniDocBench): 0.109(旧モデルの0.140から改善)
  • プログラミング作成(SWE-Bench Pro): 既存の最先端モデルと同等以上の性能を維持しつつ、待ち時間を短縮。「/fastモード」を使えば最大1.8倍のスピードで処理が可能。

🛡️ 安全性の確保(セキュリティ)

AIが思考プロセスをごまかさない(隠蔽能力が低い)ことを確認する新しい評価基準「CoT controllability」を公開し、悪用を防ぐための安全対策も継続して強化されています。


📅 いつから、どのプランで使える?

新モデルは2026年3月5日より、段階的に提供が開始されています。システム連携での利用: 同日より「gpt-5.4」としてAPI提供が開始されています。

ChatGPTでの利用: * 「Plus」「Team」「Pro」プランで利用可能。「Enterprise」「Edu」プランは管理者の設定で有効化できます。

より高性能な「GPT-5.4 Pro」は、「Pro」および「Enterprise」プラン限定です。