マルチモーダルAI「o1 Pro」:o1 Proとo1のどちらを選ぶべきか?ChatGPT Proの特徴と活用方法

2024年12月6日、OpenAIはo1-previewの完全版である「OpenAI o1」と、新たなサブスクリプションモデル「ChatGPT Pro」を組み合わせた「OpenAI o1 pro」を発表しました。この新モデルは、o1-previewから性能が大幅に向上しただけでなく、マルチモーダル機能も新たに備えています。また、12月6日から18日までの12日間にわたり、OpenAIから次々と重要な発表が予定されており、これらの詳細についても順次お伝えしていきます。

 

o1 Pro登場!OpenAIのマルチモーダル革命と12日間の重大発表

 

 

OpenAIは、「12 Days of OpenAI」(OpenAIの12日間)として「12 days. 12 livestreams. A bunch of new things, big and small. 12 Days of OpenAI starts tomorrow.」と発表し、12月6日から12日間連続で重大な発表を行うことを明らかにしました。初日となる1日目の発表は、マルチモーダル機能を搭載した「OpenAI o1」と「o1-pro」の登場です。これらの発表は、毎朝日本時間午前3時(アメリカ時間午前10時)に公開される予定です。毎日記事を更新していきますので、ぜひチェックしてください。

o1と4oの違いに関する徹底解説記事はこちら:https://allai.jp/o1/

o1-previewについて詳しく知りたい方はこちら:https://allai.jp/openai-o1-preview/

 

o1の革新:マルチモーダルAIがもたらす新しい可能性

o1の完全版では、従来対応できなかった画像やファイルなどのマルチモーダル機能が新たに追加され、さらに数学やコード分野の性能が約1.5倍から2倍に向上しました。
マルチモーダル機能の追加により、「思考するAI」として、社内のExcelやPowerPointなどのデータを分析、助言を行うといった、より幅広いコンサルティング的な活用が可能になるでしょう。

以下のグラフは、o1-preview、完全版o1、そしてo1 pro modeの性能を比較したものです。「Pass@1 Accuracy」は、モデルが問題に対して最初に生成した解答が正解である確率を示す指標であり、初回回答が適切であることで、以降の回答精度も向上する傾向があります。

例えば、数学性能については、アメリカ数学オリンピックへの進出を目指す学生向けの数学試験で、o1-previewの正答率が50%だったのに対し、o1では78%へと1.5倍の向上を見せました。さらに、コード性能では、o1が62%の正答率を記録したのに対し、o1 proでは89%と、1.4倍にまで性能が向上しています。

 

 

4/4 Reliabilityは、モデルが複数回試行した際に、一貫して正解を出し続ける確率を示す指標です。この指標は、特に複数の解答候補を生成した際に、それらの一貫性や信頼性を評価するために用いられます。

まず、数学分野における性能を比較すると、o1-previewの正答率は37%であるのに対し、o1では67%と、約2倍の向上が見られます。また、コード分野では、o1-previewの正答率が26%であるのに対し、o1では75%と、約3倍の向上が確認できます。

 

o1 Proとo1-previewの違いを徹底解説

さらに、「o1」と「o1 pro」を比較すると、o1の数学性能が67%であるのに対し、o1 proでは80%に向上しています。同様に、コード性能はo1-previewの64%からo1で75%、さらにo1 proでは89%へと進化しています。また、科学知識に関する性能も、o1の67%からo1 proでは74%へと10%以上の改善が見られます。

これらの結果から、4/4 Reliabilityの指標においてo1 proは、解答に一貫性があり、回答の安定性が向上しています。その結果、回答の途中で脱線したり、ハルシネーションが発生しにくくなっています。

 

ChatGPT Pro:研究者やプログラマーに最適なプラン

従来のChatGPT Plusに加え、新たにChatGPT Proプランが追加されました。ChatGPT Proに加入すると、月額200ドル(30,000円)で、最高性能を誇るモデルo1 proを利用することが可能になります。一方、月額20ドル(3,000円)のPlusプランではo1 proの利用はできませんが、Proプランでは無制限に利用することができます。以下に、ProプランとPlusプランの違いについて説明します。

  • o1 proの無制限利用:Proプランでは、最高性能のモデル「o1 pro」を回数制限なく使用可能。
  • o1の使用制限:Plusプランでは「o1」は週に50回のメッセージ制限。
  • o1 miniの使用制限:Plusプランでは「o1 mini」は1日50回までのメッセージ制限。

どのような人にProプランをおすすめするか:

Proプランは月額30,000円と高額です。そのため、研究者やプログラマーなど、o1を頻繁に利用し、制限回数を超えて活用する必要がある方に特におすすめです。一方で、そこまで頻繁に利用しないライトユーザーであれば、Plusプランでも十分対応できるでしょう。

Proプランにより解放されるo1 proでは性能が向上するだけでなく、ハルシネーションが減少し、解答に一貫性が生まれるという利点があります。そのため、プログラミングや研究のような精密さが求められる場面でAIを活用したい方、また、AIの解答により高い信頼性を求める方には、Proプランを選ぶ価値があると言えます。

 

まとめ

  • o1のマルチモーダル機能の追加:数学性能やコード性能が大幅に向上し、画像やファイル解析が可能なマルチモーダル機能を搭載したo1が登場しました。

  • o1 proのリリース:o1よりも一貫性が高く、正答率が向上した、より信頼性の高いプレミアムモデルです。

  • ChatGPT Proのサブスクリプションモデルの導入:o1 proの利用と、o1を無制限で利用可能な最上位プランが新たに提供されました。

12日間の発表の中で、初日を飾った『o1 pro』は、AIのマルチモーダル機能を新たなレベルへと引き上げる、画期的な製品です。完全版o1の登場により、画像やファイルを含むマルチモーダル機能を搭載した「考えるAI」が実現しました。この進化により、企業のデータやグラフを基にした高度な分析やアドバイスといった、幅広い用途での活用が期待されます。さらに、Proモデルを選択することで、o1を無制限に利用できるため、AIを頻繁に活用する研究者やプログラマーにとっては特に魅力的な選択肢となるでしょう。

今回の発表は、OpenAIによる12日間連続の重大発表の1日目にあたります。今後の発表内容も順次お届けしていきますので、ぜひお見逃しなく!

 

参考文献

  1. モデルカード
  2. ChatGPT o1とは