OpenAI新モデルo3・o4-mini登場:AIエージェント時代への跳躍

OpenAIは2025年4月16日(米国時間)に、oシリーズの最新モデルである、「o3」と「o4-mini」を発表・公開しました。この記事では、これらの最新モデルについて、その性能を詳しくご紹介していきます。

【この記事のポイント】
  • OpenAI史上最高性能の推論モデル「o3」が登場
  • 視覚情報を活用した「Thinking with Images」機能が搭載
  • 軽量で高速な「o4-mini」モデルの提供開始
  • 無料ユーザーも「o4-mini」を利用可能に!

目次

  1. はじめに:AIエージェント実現への前進
  2. o3の特徴
  3. o4-miniの特徴
  4. o3/o4-miniの使用レビュー
  5. 新モデルの実践的な活用例
  6. モデルのアクセスについて
  7. まとめ

1.はじめに:AIエージェント実現への前進

OpenAIは、生成AI分野をけん引する企業として近年大きな注目を集めています。生成AI分野の中でも注目すべきトレンドが、「AIエージェント」と呼ばれる概念です。これは、ユーザーの意図を理解し、適切なツールを自律的に選択・活用して課題を解決する、まさに“エージェント”のように振る舞う生成AIを指します。OpenAIはこのビジョンのもと、昨年末から推論モデルシリーズ「o」を開発しており、今回発表された「o3」と「o4-mini」はその最新モデルです。

これらのモデルは次のような特徴を持っています。

  • ツールの自律的な活用
  • 視覚情報と推論を統合
  • さらに進化した推論能力

以降では、それぞれのモデルの特徴について、詳しく解説していきます。

 

2.o3の特徴

OpenAIが4月16日に発表した最新の推論モデル「o3」は、AIエージェントの実現に向けた重要なステップとして位置づけられており、実際にMMMUやコーディングや数学のベンチマークでも新たな最高記録を達成しました。

●画像を用いた推論(Thinking with Images)

「o3」は、視覚情報を推論プロセスに組み込んでいく「Thinking with Images」という機能を搭載しています。これは入力した画像や図表を理解して、その内容をもとに深い分析をする機能となっています。画像がぼやけていたり、反転していたり、画質が低かったりしても、ズームや回転などの操作を推論プロセスの一部として実行することができます。記事の後半では、実際にThinking with Imagesの機能を試していきます。

●多様なツールの統合

​OpenAIの最新推論モデル「o3」は、ChatGPT内のすべてのツールを自律的に活用し、複雑なタスクに対応する高度な推論能力を備えています。​これには、Web検索、Python実行、画像生成、ファイル解析などが含まれ、ユーザーの意図に応じて適切なツールを選択・組み合わせて課題を解決します。​このようなエージェント的な振る舞いを実現するために、OpenAIは大規模な強化学習を通じて、ツールの使用方法だけでなく、どのタイミングでツールを呼び出して推論を行うかという判断力もモデルに学習させました。​

 

3.o4-miniの特徴

OpenAIは、軽量かつ高速な推論モデル「o4-mini」も公開しました。特にコスト効率と処理速度を重視した設計が特徴となっており、高度な推論能力を備える「o3」に対して、「o4-mini」は日常的なタスクなどでの活用が期待されます。

「o4-mini」は「o3」と比較しても引けをとらないモデルとなっており、一部のベンチマークでは「o3」を上回る性能を示したものもあります。左から順に、数学、数学、コーディングのベンチマーク評価となっています。

 

4.o3/o4-miniの使用レビュー

ここでは、OpenAIの最新推論モデルを実際に使用して、その性能を調査していきます。今回の最新モデルには様々な機能が追加され、推論能力も大幅にアップしました。中でも画像をもとに推論を行う「Thinking with Images」は興味深い革新的な技術でしょう。そこで、今回はこの機能を試していきます。

タスク内容

「ナポレオンの戴冠式」で知られる「ナポレオン一世の戴冠式と皇妃ジョセフィーヌの戴冠」の複製画をモデルに提示し、その展示場所を推定させる。

背景情報

  • オリジナル作品はパリのルーブル美術館に所蔵されている。
  • 複製画はベルサイユ宮殿に所蔵され、オリジナルと一部異なる描写がある。

最新の推論モデルは、異なるデザインを見分けることができるのでしょうか?

なお、使用した画像データは、ベルサイユ宮殿の公式ウェブサイトから取得したものです。

o3の場合

画像とタスクに関するプロンプトを入力して、推論を開始させてみます。

指示通りに「Thinking with Images」モードで検索や画像の拡大などを活用しながら推論する様子が見られました。そして、遂に重要な手がかりにたどり着きます!

以上のように、絵画の展示施設を正しく推理することができました。

o4-miniの場合

o4-miniの場合も同様に、o3のときと同じプロンプトを入力してみましょう。

​残念ながら、o4-miniはこのタスクにおいて期待された結果を出すことができませんでした。​画像から展示場所を推定するという課題に対し、初回の応答では誤った推論を行いました。​追加の対話を重ねることで正答に近づく可能性はありますが、初期の段階では失敗に終わったと言えます。

  • 使用感のまとめ

今回試した「Thinking with Images」機能では、正答にたどり着いたのはo3のみでした。推論の精度を踏まえても、現時点ではo4-miniよりもo3のほうが一歩リードしている印象です。特に視覚情報をもとにした複雑な推論では、o3の安定感が際立ちました

 

5.新モデルの実践的な活用例

OpenAIの最新推論モデルは、実践的にはどのようなところで活用できるでしょうか。以下にいくつかの活用例を提案していきます。

  • 複雑なデータ分析とレポート作成

OpenAI o3は、Web検索やPython実行、ファイル解析などのツールを組み合わせて使用できるため、複雑なデータセットの分析やレポート作成において、大いに役に立つ可能性があります。実際のOpenAIの公式ブログでも、Web検索とデータ分析を統合することで、最適なマーケティング戦略を提案している様子が公開されています。o3は視覚的な図表を含む詳細なレポートを自動的に生成することも可能です。

  • ソフトウェア開発やコードのレビュー

OpenAI o3/04-miniは、これまでのGPTシリーズやoシリーズと比較しても、そのコーディングに高い性能を誇ります。そのため、コードの生成やデバッグ、最適化などといったソフトウェア開発の様々なフェーズで活用が期待されます。

  • 視覚情報を活用した教育分野での利用

特にOpenAI o3では「Thinking with Images」という大きな機能の追加が行われました。この機能により、手書きの図やホワイトボードの写真などの視覚的な情報を理解し、推論に活用することができます。これを教育に活用すれば、教育現場における教材作成や生徒側の質問解決などを円滑に進められるようになる可能性があります。ただし生成AIの利用においては、常にハルシネーションに注意する必要があります。

 

6.モデルのアクセスについて

ChatGPT Plus, Pro、Teamプランのユーザーは、最新のモデル「o3」「o4-mini」「o4-mini-high」にアクセスすることができます。これらのモデルは「o1」「o3-mini」「o3-mini-high」に置き換わる形で提供されており、旧モデルは4月16日の新モデル公開と同時に利用不可となりました。

無料ユーザーでも「Think」を選択することで、「o4-mini」を試すことができます。ただし利用には制限があり、一日当たりのメッセージ数などに限りがあります。

加えて、Proユーザー向けには、これまで「o1-pro」が提供されてきましたが、今後数週間以内に「o3-pro」がリリースされる予定です。

 

7.まとめ

OpenAIが発表した新たな推論モデル「o3」と「o4-mini」は、AIの活用ステージを次のフェーズへと押し上げる可能性を秘めています。

特に「o3」は、画像を読み解き、必要に応じてツールを組み合わせながら思考を進めるなど、“AIエージェント”としての自律的な推論に近づきつつあります。実際の使用においても、画像をもとに文脈を読み取り、正しい判断にたどり着く様子にはある種の感動を覚えました。

一方で「o4-mini」は軽量で高速な特性を活かし、日常的な作業や簡易的な推論タスクでの実用性が期待されるモデルです。無料ユーザーでも使用できる点も含め、今後の普及に大きな役割を果たすでしょう。

今後のAIエージェントの進化を見据える上でも、「o3」と「o4-mini」は押さえておくべき重要なモデルと言えるでしょう。これからも最新のLLM、生成AIに注目していきましょう。

 

【参考文献・画像出典】
  • Introducing OpenAI o3 and o4-mini – OpenAI
  • Sacre de Napoléon et couronnement de Joséphine à Notre-Dame de Paris, 2 décembre 1804 – collections, Chateau De Versailles