2024.12.06

GPT-4o miniとは？性能と特徴や注意点、活用方法を解説

コラム

#ChatGPT

#生成AI

#業務効率化

#ITコンサルティング

#AI

「GPT-4o mini」をご存じでしょうか？GPT-4o miniは、2024年7月18日に発表されたGPT-4oの最新モデルです。低コストかつスピーディーな処理速度が魅力で、注目を集めています。

本記事では、GPT-4o miniの概要や特徴・メリットと注意点、活用方法について詳しく解説します。GPT-4o miniについて知りたい方、低コストでChatGPTを利用し業務を効率化したい方は、ぜひ参考にしてください。

生成AI活用事例100選をダウンロードする

GPT-4o miniとは

GPT-4o mini（ジーピーティーフォー・オー・ミニ）は、2024年7月18日にアメリカのOpen AIが発表したGPT-4oの最新モデルです。
➡ChatGPT-4o(GPT-4o)とは？次回アップデートはいつ？

近年は、技術の向上にともないLLM（大規模言語モデル）の開発が増加していますが、GPT-4o miniはSLM（小規模言語モデル）をベースに開発されています。LLMとは大量のデータとディープラーニング（深層学習）により構築された言語モデルのことで、SLMとは特定タスクの処理を得意とする軽量型言語モデルのことです。
➡LLM（大規模言語モデル）とは？仕組みや活用事例、今後の展望を徹底解説

GPT-4o miniは、SLMを基盤とすることで高性能かつ高いコスト効率を実現しており、GPT-4oの軽量モデルとして注目を集めています。ここからは、GPT-4o miniの料金と速度について詳しく解説します。

GPT-4o miniの料金

ChatGPT-4o miniは、アカウント作成をしていれば無料版であっても利用できます。また、活用における回数制限はありません。無料ユーザーの場合、デフォルトで使用するモデルがGPT-4oになっていますが、回数制限（5時間で約10回）を超えると自動的にGPT-4o miniに切り替わる仕組みになっています。

APIを利用する場合の料金は以下の通りです。

100万トークンを入力する際の料金	100万トークンを出力する際の料金	150×150ピクセル画像を生成する料金（試算）
0.15ドル	0.6ドル	0.001275ドル

トークンとは、ChatGPTが処理するテキスト単位のことで、英語は1単語が約1トークン、日本語は1文字が1～3トークン程度です。

GPT-4o miniの速度

GPT-4o miniでは、1秒あたり約166トークンの処理が可能です。GPT-4oの処理速度は1秒当たり約84トークンであるため、2倍程度の処理能力となっています。仮に1英単語を1トークン、日本語1文字を2.5トークで処理すると仮定して試算した場合、1秒で166英単語・66.4文字の日本語処理が可能です。

Eval Benchmarkに基づくGPT-4o miniの性能評価

出典：GPT-4o mini: advancing cost-efficient intelligence｜OpenAI

OpenAIはGPT-4o miniを発表するとともに、以下の項目における生成AIモデルの比較データを公表しました。

MMLU：テキストの理解や言語処理を行う性能に関する評価
GPQA：大学院レベルの専門的な知識と論理的な思考に関する評価
DROP：推論能力に関する評価
MGSM：テキストや画像など異なる形式のデータを統合・処理する能力に関する評価
MATH：複数ステップの数学的な能力に関する評価
HumanEval：プログラムを生成する機能の正しさに関する評価
MMMU：大学レベルの知識と推論に関する評価
MathVista：視覚的なコンテキストにおける数学的推論能力に関する評価

ここからはOpenAIが公表した比較データを参考に、上記各項目におけるGPT-4o miniの性能について詳しく解説します。

MMLU

MMLU（Massive Multitask Language Understanding）は、テキストの理解や言語処理を行う性能を評価するベンチマークです。以下を含め57科目の多肢選択法の問題を解き、性能が評価されます。

初等数学
米国史
コンピュータサイエンス
法律

GPT-4o miniの精度は82.0%でGPT-4oの次に高い数値となっており、質疑応答や文章理解、文脈把握などにおいて優れた性能が期待できます。

GPQA

GPQA（General Purpose Question Answering）は、大学院レベルの専門的な知識と論理的な思考を評価するベンチマークです。GPT-4o miniの精度は2位の40.2%で、他の生成AIモデルよりも多くの質問に対する回答が期待できます。

DROP

DROP（Discrete Reasoning Over Paragraphs）は、推論の読解力を評価するベンチマークです。55,000問の問題に取り組み、理解・推論する能力が評価されます。GPT-4o miniの精度は79.7%で、他のAIモデルと比較しても遜色ない高い数値です。質問の文脈から推論して適切な回答をする能力があるでしょう。
ちなみに、人間の専門家が行った正答率は96.4%でした。

MGSM

MGSM（Multimodal Generative and Selective Modeling）は、テキストや画像など異なる形式のデータを統合・処理する能力を評価するベンチマークです。GPT-4o miniの精度は2位の87.0%で高い数値を記録しています。複数データの処理に関する高い能力が期待できます。

MATH

MATH（Mathematics Benchmark）は、複数ステップの数学的な能力を評価するベンチマークです。GPT-4o miniの精度は70.2%で、GPT-4oと同様に他の生成AIモデルを大きく上回る精度を記録しています。複数ステップの数学的な能力は、生成AIモデルの中でも高いでしょう。

HumanEval

HumanEvalは、プログラムを生成する機能の正しさを評価するベンチマークです。GPT-4o miniの精度は87.2%で、GPT-4oに次ぐ高度なプログラミング能力が期待できます。

MMMU

MMMU（Multimodal Model for Mathematical Understanding）は、大学レベルの知識と意図的な推論を必要とする大規模かつ複数分野のタスクにおけるマルチモーダルモデルを評価するベンチマークです。以下6つの分野における大学の試験やクイズ、教科書から収集された質問により評価が行われます。

芸術とデザイン
ビジネス
科学
健康と医学
人文科学と社会科学
技術と工学

GPT-4o miniの精度は、1位のGPT-4oと比べ低いものの2位の59.4%となっています。

MathVista

MathVistaは、視覚的なコンテキストにおける数学的推論能力を評価するベンチマークです。MathVistaで高い評価を得るには、高い視覚的理解能力と構成的推論が必要とされます。GPT-4o miniの精度は56.7%となっており高水準ではありませんが、1位のGPT-4oでも63.8%です。今後、技術が発展すればより精度が高まるでしょう。

GPT-4o miniの特徴やメリット

GPT-4o miniには、以下の特徴やメリットがあります。

コストが安い
出力スピードが早い
ファインチューニングができる
APIを利用できる

順に解説します。

コストが安い

GPT-4o miniはリソース効率が高く、他のモデルと比べ低コストで利用可能です。実際に、ChatGPTの主なモデルとAPIの利用料金を比較した表が以下です。

モデル	100万トークンを入力する際の料金	100万トークンを出力する際の料金	150×150ピクセル画像を生成する料金（試算）
GPT-4o mini	0.15ドル	0.6ドル	0.001275ドル
GPT-3.5 Turbo	0.5ドル	1.5ドル	ー
GPT-4	30ドル	60ドル	ー
GPT-4 Turbo	10ドル	30ドル	0.00255ドル
GPT-4o	5ドル	15ドル	0.000638ドル

APIのコストを比較するとGPT-4o miniは圧倒的に低価格で、GPT-4oの30分の1程度で利用できます。低コストで利用できるため、企業や個人が開発・活用しやすいでしょう。

出力スピードが早い

GPT-4o miniは、GPT-4oと比べ2倍程度の処理能力を有しておりスピーディーな出力速度が特徴です。処理速度におけるAIモデルの比較表は以下の通りです。

モデル	1秒当たりの出力トークン	ファーストレスポンストークン
GPT-4o mini	166.1	0.57
GPT-4o	83.8	0.45
Claude 3.5 Sonnet	78.6	1.11
Gemini 1.5 Pro	58.3	1.03
Gemini 1.5 Flash	164.9	1.03

例えば、チャットボットやカスタマーサポートとして活用すれば、ユーザーのストレスを軽減して満足度の向上が期待できます。

ファインチューニングができる

GPT-4o miniでは、新しいデータを追加・再訓練して、特定のタスクや用途に合わせAIを最適化するプロセスのファインチューニングが可能です。自社用にカスタマイズすれば、より効果的な活用が実現するでしょう。トレーニングコストも低いため、コストパフォーマンスの高いファインチューニングができます。