GPT-4o miniとは?性能と特徴や注意点、活用方法を解説

コラム
#ChatGPT
#生成AI
#業務効率化
#ITコンサルティング
#AI
GPT-4o mini

「GPT-4o mini」をご存じでしょうか?GPT-4o miniは、2024年7月18日に発表されたGPT-4oの最新モデルです。低コストかつスピーディーな処理速度が魅力で、注目を集めています。

本記事では、GPT-4o miniの概要や特徴・メリットと注意点、活用方法について詳しく解説します。GPT-4o miniについて知りたい方、低コストでChatGPTを利用し業務を効率化したい方は、ぜひ参考にしてください。

GPT-4o miniとは

GPT-4o mini(ジーピーティーフォー・オー・ミニ)は、2024年7月18日にアメリカのOpen AIが発表したGPT-4oの最新モデルです。
ChatGPT-4o(GPT-4o)とは?次回アップデートはいつ?

近年は、技術の向上にともないLLM(大規模言語モデル)の開発が増加していますが、GPT-4o miniはSLM(小規模言語モデル)をベースに開発されています。LLMとは大量のデータとディープラーニング(深層学習)により構築された言語モデルのことで、SLMとは特定タスクの処理を得意とする軽量型言語モデルのことです。
LLM(大規模言語モデル)とは?仕組みや活用事例、今後の展望を徹底解説

GPT-4o miniは、SLMを基盤とすることで高性能かつ高いコスト効率を実現しており、GPT-4oの軽量モデルとして注目を集めています。ここからは、GPT-4o miniの料金と速度について詳しく解説します。

GPT-4o miniの料金

ChatGPT-4o miniは、アカウント作成をしていれば無料版であっても利用できます。また、活用における回数制限はありません。無料ユーザーの場合、デフォルトで使用するモデルがGPT-4oになっていますが、回数制限(5時間で約10回)を超えると自動的にGPT-4o miniに切り替わる仕組みになっています。

APIを利用する場合の料金は以下の通りです。

100万トークンを入力する際の料金 100万トークンを出力する際の料金 150×150ピクセル画像を生成する料金(試算)
0.15ドル 0.6ドル 0.001275ドル

トークンとは、ChatGPTが処理するテキスト単位のことで、英語は1単語が約1トークン、日本語は1文字が1~3トークン程度です。

GPT-4o miniの速度

GPT-4o miniでは、1秒あたり約166トークンの処理が可能です。GPT-4oの処理速度は1秒当たり約84トークンであるため、2倍程度の処理能力となっています。仮に1英単語を1トークン、日本語1文字を2.5トークで処理すると仮定して試算した場合、1秒で166英単語・66.4文字の日本語処理が可能です。

生成AI活用事例100選のダウンロードページ

Eval Benchmarkに基づくGPT-4o miniの性能評価

出典:GPT-4o mini: advancing cost-efficient intelligence|OpenAI

OpenAIはGPT-4o miniを発表するとともに、以下の項目における生成AIモデルの比較データを公表しました。

  • MMLU:テキストの理解や言語処理を行う性能に関する評価
  • GPQA:大学院レベルの専門的な知識と論理的な思考に関する評価
  • DROP:推論能力に関する評価
  • MGSM:テキストや画像など異なる形式のデータを統合・処理する能力に関する評価
  • MATH:複数ステップの数学的な能力に関する評価
  • HumanEval:プログラムを生成する機能の正しさに関する評価
  • MMMU:大学レベルの知識と推論に関する評価
  • MathVista:視覚的なコンテキストにおける数学的推論能力に関する評価

ここからはOpenAIが公表した比較データを参考に、上記各項目におけるGPT-4o miniの性能について詳しく解説します。

MMLU

MMLU(Massive Multitask Language Understanding)は、テキストの理解や言語処理を行う性能を評価するベンチマークです。以下を含め57科目の多肢選択法の問題を解き、性能が評価されます。

  • 初等数学
  • 米国史
  • コンピュータ サイエンス
  • 法律

GPT-4o miniの精度は82.0%でGPT-4oの次に高い数値となっており、質疑応答や文章理解、文脈把握などにおいて優れた性能が期待できます。

GPQA

GPQA(General Purpose Question Answering)は、大学院レベルの専門的な知識と論理的な思考を評価するベンチマークです。GPT-4o miniの精度は2位の40.2%で、他の生成AIモデルよりも多くの質問に対する回答が期待できます。

DROP

DROP(Discrete Reasoning Over Paragraphs)は、推論の読解力を評価するベンチマークです。55,000問の問題に取り組み、理解・推論する能力が評価されます。GPT-4o miniの精度は79.7%で、他のAIモデルと比較しても遜色ない高い数値です。質問の文脈から推論して適切な回答をする能力があるでしょう。
ちなみに、人間の専門家が行った正答率は96.4%でした。

MGSM

MGSM(Multimodal Generative and Selective Modeling)は、テキストや画像など異なる形式のデータを統合・処理する能力を評価するベンチマークです。GPT-4o miniの精度は2位の87.0%で高い数値を記録しています。複数データの処理に関する高い能力が期待できます。

MATH

MATH(Mathematics Benchmark)は、複数ステップの数学的な能力を評価するベンチマークです。GPT-4o miniの精度は70.2%で、GPT-4oと同様に他の生成AIモデルを大きく上回る精度を記録しています。複数ステップの数学的な能力は、生成AIモデルの中でも高いでしょう。

HumanEval

HumanEvalは、プログラムを生成する機能の正しさを評価するベンチマークです。GPT-4o miniの精度は87.2%で、GPT-4oに次ぐ高度なプログラミング能力が期待できます。

MMMU

MMMU(Multimodal Model for Mathematical Understanding)は、大学レベルの知識と意図的な推論を必要とする大規模かつ複数分野のタスクにおけるマルチモーダルモデルを評価するベンチマークです。以下6つの分野における大学の試験やクイズ、教科書から収集された質問により評価が行われます。

  • 芸術とデザイン
  • ビジネス
  • 科学
  • 健康と医学
  • 人文科学と社会科学
  • 技術と工学

GPT-4o miniの精度は、1位のGPT-4oと比べ低いものの2位の59.4%となっています。

MathVista

MathVistaは、視覚的なコンテキストにおける数学的推論能力を評価するベンチマークです。MathVistaで高い評価を得るには、高い視覚的理解能力と構成的推論が必要とされます。GPT-4o miniの精度は56.7%となっており高水準ではありませんが、1位のGPT-4oでも63.8%です。今後、技術が発展すればより精度が高まるでしょう。

GPT-4o miniの特徴やメリット

GPT-4o miniには、以下の特徴やメリットがあります。

  • コストが安い
  • 出力スピードが早い
  • ファインチューニングができる
  • APIを利用できる

順に解説します。

コストが安い

GPT-4o miniはリソース効率が高く、他のモデルと比べ低コストで利用可能です。実際に、ChatGPTの主なモデルとAPIの利用料金を比較した表が以下です。

モデル 100万トークンを入力する際の料金 100万トークンを出力する際の料金 150×150ピクセル画像を生成する料金(試算)
GPT-4o mini 0.15ドル 0.6ドル 0.001275ドル
GPT-3.5 Turbo 0.5ドル 1.5ドル
GPT-4 30ドル 60ドル
GPT-4 Turbo 10ドル 30ドル 0.00255ドル
GPT-4o 5ドル 15ドル 0.000638ドル

APIのコストを比較するとGPT-4o miniは圧倒的に低価格で、GPT-4oの30分の1程度で利用できます。低コストで利用できるため、企業や個人が開発・活用しやすいでしょう。

出力スピードが早い

GPT-4o miniは、GPT-4oと比べ2倍程度の処理能力を有しておりスピーディーな出力速度が特徴です。処理速度におけるAIモデルの比較表は以下の通りです。

モデル 1秒当たりの出力トークン ファーストレスポンストークン
GPT-4o mini 166.1 0.57
GPT-4o 83.8 0.45
Claude 3.5 Sonnet 78.6 1.11
Gemini 1.5 Pro 58.3 1.03
Gemini 1.5 Flash 164.9 1.03

例えば、チャットボットやカスタマーサポートとして活用すれば、ユーザーのストレスを軽減して満足度の向上が期待できます。

ファインチューニングができる

GPT-4o miniでは、新しいデータを追加・再訓練して、特定のタスクや用途に合わせAIを最適化するプロセスのファインチューニングが可能です。自社用にカスタマイズすれば、より効果的な活用が実現するでしょう。トレーニングコストも低いため、コストパフォーマンスの高いファインチューニングができます。

APIを利用できる

GPT-4o miniではAPIを利用でき、他システムとの連携や開発が可能です。
単体でも活用できますが、他のシステムと連携させれば、利用の幅や効果が高まるでしょう。コストが安く、APIを利用しやすい点も魅力です。

GPT-4o miniの注意点

GPT-4o miniを活用する際には、以下に注意しましょう。

  • GPT-4oより品質がおちる
  • 学習データが少ない

順に解説します。

GPT-4oより品質がおちる

低コストでの利用やスピーディーな処理が魅力のGPT-4o miniですが、GPT-4oに比べると品質が劣るケースも存在します。とくに、以下の複雑なタスクを実施する場合、GPT-4oと比べてやや精度が低い回答が行われる可能性があります。

  • 複雑な推論能力が求められるタスク
  • 専門的な知識が必要な高度なタスク
  • 長文の生成や詳細な分析

また、利用できる機能数も多くありません。効果的に活用するには、GPT-4oとGPT-4o miniの使い分けが重要です。

学習データが少ない

GPT-4o miniはSLMをベースに開発が行われているため、学習データが少なくなっています。基本的な活用は問題ありませんが、専門的な分野や高度な知識が必要とされるタスクに対して、回答するための情報が不足する可能性があります。

また、GPT-4o miniが学習しているのは2023年10月までのデータです。最新情報が得られないケースがあるため、内容に誤りがないかの確認が必要です。

GPT-4o miniの活用方法

GPT-4o miniの主な活用方法は以下の3つです。

  • 単体で活用する
  • APIサービスを活用する
  • 独自システムを開発する

順に解説します。

単体で活用する

GPT-4o miniは、ChatGPTの公式サイトにアクセスすれば、無料ユーザーであっても単体で活用できます。ただし、デフォルト設定では、生成AIモデルを改善する目的で入力データが利用される可能性があります。業務で活用する場合は、入力情報に注意しましょう。

APIサービスを活用する

GPT-4o miniのAPIサービスを利用する方法もあります。今後、多くのシステム会社がGPT-4o miniと連携させたサービスを提供する可能性があります。自社開発する必要がなく、セキュリティ対策なども施されている可能性が高いため、要件に合うサービスがあれば利用するのも良いでしょう。

独自システムを開発する

自社で独自にシステム開発する活用も可能です。独自開発であれば、自社の業務やフローに合わせたシステムを構築できます。ただ、独自開発には専門のエンジニアが必要です。

まとめ

2024年7月18日に発表されたGPT-4o miniは、低コストかつスピーディーな処理速度が魅力であるGPT-4oの最新モデルです。SLMをベースに開発されているため、学習データが少くGPT-4oより品質がおちるケースもありますが、上手く使い分けを行えば、高い利便性が期待できます。

ただ、GPT-4o miniの出力はプロンプトの精度に比例するため、入力する質問や指示に関する工夫が重要です。
SMSデータテックでは、ChatGPTの使い方や効果的なプロンプトを作成する方法、注意点などを解説する講座を開催しています。ChatGPTを上手に使いたい方は、ぜひご参加ください。

ChatGPT入門講座のサービスページ

まずはお気軽にご相談ください
お問い合わせフォーム

おすすめイベント・セミナー 一覧へ