
3月25日(火)に「ASMで進化するサイバー攻撃対策~情報漏洩を防ぐための攻撃面の可視化~」のセミナーを開催いたします。 ※開始30分...
OpenAI o3とはOpenAIが2024年12月21日に発表したAIモデルのことで、o3-miniはo3の軽量モデルです。高い推論能力が特徴で、従来のAIモデルでは正解率が30%程度だったテストで、低計算モードでも75.7%の正解率を記録しました。
本記事では、OpenAI o3・o3-miniモデルの概要やGPT-4o・Gemini 2.0などとの比較、公開時期と料金プランについて解説します。OpenAI o3・o3-miniモデルについて知りたい方は、ぜひ参考にしてください。
目次
OpenAI o3とは、与えられた情報やデータに基づき新たな知識や結論を導き出す推論に特化したo1の次世代モデルのことです。スペインの通信業者におけるブランド「O2」と混同を防ぐ目的で、o2ではなくo3となっています。「12日間のOpenAI」と呼ばれるイベントの最終日である2024年12月21日に発表されました。また、併せてコスト効率と応答性に優れた軽量モデルであるo3-miniも発表されています。
これまで開発された多くのAIモデルは、特定のタスクや学習した範囲内でのみ機能していました。ただ、o3は人間と同じように未知のタスクや複雑な問題に対しても高い推論能力と柔軟性を発揮することを目指して開発され、多くの注目を集めています。
ここからは、OpenAI o3とo3-miniの特徴について解説します。
OpenAI o3における最大の特徴は、非常に高度な推論能力です。private chain of thoughtという独自のテクノロジーが採用されており、煩雑な問題であっても解決できます。性能の詳細は後ほど解説します。
OpenAI o3-miniの特徴は、推論能力と効率性が兼ね備えられていることです。OpenAI o3は高度な推論能力を実現している一方で、高過ぎる計算コストが課題となっています。o3-miniは計算コストを抑えた設計になっており、アダプティブ・シンキング・タイム(思考時間)も低・中・高の3段階から選択可能です。
OpenAI o3は、従来のAIモデルでは正解率が最高でも30%程度だったARC-AGIにおいて、低計算モードで75.7%、高計算モードで87.5%の正解率を記録しました。ARC-AGIとは、人間は比較的簡単に解ける一方で、AIには極めて困難とされる視覚的モデル集ARC(Abstract Reasoning Corpus)をベースに設計された、AIの汎化能力を評価するベンチマークのことです。
参照:OpenAI o3 が ARC-AGI-Pub で画期的なハイスコアを獲得|ARC PRIZE
また、オンラインで開催される有名なアルゴリズム・プログラミングコンペティションサイトのCodeforcesでは、世界175位のプログラマーと同じ点数である2,727点を記録しました。さらに、数学の分野ではPhD(博士)レベルの問題集であるGPQAにおいて、87.7%の正解率を記録しました。
参照:OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12|YouTube
ここからは、以下について解説します。
参照:OpenAI o3 が ARC-AGI-Pub で画期的なハイスコアを獲得|ARC PRIZE
OpenAI o3とo1の性能における一部を比較した表が以下です。
OpenAI o3 | OpenAI o1 | |
---|---|---|
ARC-AGI | 75.7%~87.5% | 7.8%~32% |
Codeforces | 2,727点 | 1,891点 |
GPQA | 87.7% | 78.0% |
全てにおいてo3が上回っており、とくにARC-AGIは大幅な上昇を記録しています。
OpenAI o3はさまざまな分野、とくにARC-AGIにおいてこれまで開発されたAIモデルよりも高いスコアを記録して、高度な推論能力を証明しています。AIに関する専門家の中には「o3はAGI(汎用人工知能)に近いのでは」と考える方もいますが、開発元のOpenAIはo3に対してAGIという表現を使っていません。また、ARCの開発者であるFrançois Chollet氏も「ARC-AGIを攻略すること自体はAGIの到達を意味しない」と述べています。
ちなみに、AGI(Artificial General Intelligence)とは、人間と同様かそれ以上の知的能力を有する人工知能のことです。従来型の特定分野におけるタスク処理を行うAIとは異なり、多様な問題に対して柔軟に対処できますが、未だ開発の成功には至っていません。ただ、o3が記録した推論能力は、AIが人間の知能に近づく重要な一歩となるでしょう。
なお、AGIの詳細については以下をご覧ください。
⇒AGI(汎用人工知能)とは?できることやAI・ASIとの違い、開発の現状と未来を解説
OpenAI o3とGPT-4o・Claude 3.5・Gemini 2.0の特徴比較は以下の通りです。
OpenAI o3 | GPT-4o | Claude 3.5 | Gemini 2.0 | |
---|---|---|---|---|
推論能力 | ARC-AGIで87.5%を記録した高い推論能力があり、数学や科学的推論、構造的思考が必要なタスクの処理も可能。 | マルチモーダルタスクで高パフォーマンスを発揮して、英語以外の言語処理や文脈理解にも優れている。 | 大学レベルの知識や対話など、高度な指示への対応能力に優れている。 | マルチモーダル推論に特化しており、長文のコンテキスト理解や複合的なタスクにも対応可能。 |
適応性や応用範囲 | さまざまな分野で活用でき、少ないファインチューニングでスピーディーに新しい環境に適応する。 | 多岐にわたる用途に対応でき、テキストや音声、画像生成もスムーズに実行可能。 | カスタマーサポートやコンテンツ作成、チャットボットでの利用に適している。 | 幅広い分野で利用でき、Google検索やサードパーティツールとの連携も可能。 |
コスト | 料金は未発表だが、高計算モードでは、1タスクあたり1,000ドル以上かかったケースがあり、高額になると予想されている。 | 100万トークンあたりの入力は0.8ドルで、出力は4ドル。 | 128Kトークンまでの場合、100万トークンあたりの入力は0.075ドル、出力は0.3ドル。128Kトークンを超える場合、入力は0.15ドル、出力は0.6ドル。 | 100万トークンあたりの入力は2.5ドルで、出力は10ドル。 |
なお、Geminiの詳細を知りたい方は以下をご覧ください。
⇒Gemini(ジェミニ)とは?特徴や使い方、活用事例を解説
OpenAIでは、o3モデルの安全性強化に力を入れており、Deliberative Alignmentを導入しました。Deliberative Alignment(熟慮的アライメント)とは、AIモデルに人間の安全基準や倫理的な仕様を直接教え込み、応答を生成する前段階でその仕様に基づいた明示的な推論をさせる新たな訓練手法のことです。
従来のモデルでは、大量のデータから間接的に安全基準を学習させており、安全か危険かの2択しか判断できませんでした。しかし、Deliberative Alignmentでは、明確な安全仕様をモデルに提供して、それに基づく推論をさせることで、より高い安全性と信頼性を実現します。ユーザーが入力するプロンプトの意図を分析して、例えば以下の悪意ある欲求の検知・拒否が可能になります。
AIの種類 | 拒否する行動例 |
---|---|
自然言語処理AI |
|
画像生成AI |
|
続いて、OpenAI o3の公開時期と料金プランを紹介します。
OpenAI o3-miniは2025年1月末から一般提供が始まる予定です。また、o3はo3-miniのリリース後、順次一般提供が予定されています。ただし、具体的な日程に関しては安全性テストの結果により決定されます。OpenAIは、安全性研究者を対象に、2025年1月10日まで早期アクセスプログラムの申請を受け付けていました。安全性を確保しつつユーザーが利用しやすい環境の整備が進められています。
参照:安全性試験の早期アクセス|OpenAI公式Webサイト
OpenAI o3およびo3-miniの料金プランは、まだ発表されていませんが、月200ドル(1ドル=155円の場合31,000円)のProプランで提供されるのではと予想されています。
ただ、Proプランはo1モデルへの無限アクセスが内容に含まれており、1タスクあたりの費用が高額なo3は従量課金制になると予想する声もあります。o3でARC-AGIを実施した際の1タスクあたりコストが約20ドルでした。高計算モードでは、1タスクあたり1,000ドル以上かかったケースもあり、o3の利用は高額になる可能性もあるでしょう。
続いて、OpenAI o3の業界別活用例について解説します。
o3の驚異的な性能にて解説した通り、o3はCodeforcesで高い成果を記録しており、プログラムの生成やバグの修正、コードレビューの自動化などが活用できます。o3-miniは比較的簡易なプログラミングのサポートに利用できるでしょう。
数学や科学分野でも高い性能を記録したo3は、高度な問題の解決を期待されています。また、オンライン学習のサポートでも利用できるでしょう。
医療・ヘルスケア業もAI活用が期待されている分野です。o3の活用により、新薬の開発スピード・効率の向上やゲノム医療・手術サポートの実現に近づく可能性があります。また、o3-miniは地域医療やオンライン診療に役立つかもしれません。
なお、医療分野におけるAIの詳細は以下をご覧ください。
⇒医療AIとは?活躍が期待される分野と活用事例、メリット・デメリットを解説
金融業でo3を活用すれば、煩雑なデータ処理を効率化して、リスク解析や投資戦略の策定、詐欺の検出などに役立ちます。o3-miniは、中小企業や個人投資家向けツールとして効果を発揮するでしょう。
製造業では、ボトルネックの解消や品質管理などでの活用が期待されています。また、複雑な問題を処理できるため、複数の要素が関係する生産工程の最適化でも効果を発揮するでしょう。
社会課題の分析と解決への活用も、o3が期待されている分野です。公共政策・行政での活用を行えば、より効率的な事務処理や豊かな社会の実現に役立つでしょう。
高い推論能力を有して、さまざまな分野での活用を期待されているo3とo3-miniですが、コストが高いなどの課題も存在します。また、現状のo3では外部の検証機構や人間がラベル付けした思考過程に依存しているといわれており、AGIの実現には至ってはいません。
ただ、o3・o3-miniはこれまでのAIモデルと比較して高度な性能を備えているため、多くの課題解決に役立ち、私たちの生活を豊かにするでしょう。また、o3・o3-miniの改善がAGI開発の一翼を担う可能性も期待できます。
OpenAI o3とはOpenAIが2024年12月21日に発表したAIモデルのことで、o3-miniはo3の軽量モデルです。高い推論能力が特徴で、従来のAIモデルでは正解率が30%程度だったARC-AGIで、低計算モードでも75.7%の正解率を記録しました。また、CodeforcesやGPQAでも高い成果を上げています。詳細な公開スケジュールや料金は公開されていませんが、今後順次一般公開が進むでしょう。
OpenAI o3などを活用すれば業務を効率化できます。業務改善による生産性の向上は、企業競争力アップにもつながるため、上手く活用することが重要です。