この度、10月1日〜3日に開催される「DX総合EXPO」に出展することが決まりました!前回6月にも出展したDX総合EXPO、会場は東京...
生成AIにはどんな種類がある?基本的な原理と主要な種類を解説
生成AIは、テキストや画像、音声などのデータを、ユーザーの希望に沿って生成してくれるサービス・プロダクトです。名前にあるように機械学習を用いたAIを利用しており、従来のAIを利用したプロダクトよりも簡単に利用できることから人気を博しています。
生成AIの基礎となっているのは、テキストなどのインターネット上の情報を学習して、ユーザーの要求に適したものを提供する仕組みです。AIは学習を行うことにより、多くの情報をもとに生成を行うため、精度の高いアウトプットを実現しています。生成AIの柔軟なアウトプットは各種の事業でも活用可能なため、企業や組織からも注目の高い分野です。
本記事では、あらためて生成AIの概要からおさらいし、アウトプットごとの種類や活用事例、代表的ツールや将来展望についても紹介します。
目次
生成AIの基本原理
はじめに生成AIの概要と基本的な原理について確認しておきましょう。
生成AIとは
生成AI(Generative AI)とはAI(人工知能)を用いて文章、画像などのコンテンツを生成する仕組みです。Webサービスに組み込んで生成AIが利用できる各種サービスが提供されたことにより、利用のハードルが下がり人気が高まりました。
多くのサービスではプロンプトにテキストを入力するなどのインプットに対し、機械学習を用いてAIが学習した内容の中から最適なアウトプットを返してくれます。アウトプットの形式はサービスにより異なるため、求めるアウトプットに合わせてサービスを選択することが必要です。
基本的な仕組み
生成AIでは深層学習(ディープラーニング)と呼ばれる機械学習の手法を用いて、大量のデータを学習して、求めるコンテンツの生成に利用します。
従来のAIは「教師有り」学習が用いられることが多く、学習させる内容を精度高く予測することができました。生成AIでは「教師なし」学習を取り込み、AIが自ら学習してコンテンツを生み出せることが大きな特徴です。
さらに、生成するアウトプットの種類などによって生成AIの学習では様々なモデルが利用されます。テキストをアウトプットする場合はLLM(大規模言語モデル)、画像生成であればVAE、GANなどのモデルが利用されています。
生成AIの主要種類
生成AIの生成するデータには様々な種類があり、生成物により分類が行われています。下記では代表的な生成AIを5種類紹介します。
- テキスト生成
- 画像生成
- 動画生成
- 音声・音楽生成
- 3Dモデル生成
テキスト生成
利用者の入力に対し、テキスト(文章)を生成する生成AIです。利用者の質問に対する回答、文章の要約、他言語の翻訳、一般的な見解の回答などを行います。
画像生成
利用者の入力に対し、画像を生成する生成AIです。プロンプトからの入力テキストに対して生成AIが画像を作成して返す、利用者が提示した画像と類似した画像を作成する、画像のバリエーションを作成するなどの動作が可能です。
画像生成AIについては下記の記事で詳しく紹介しています。
➡「画像生成AIはどんな画像が作れる?代表的なサービスや活用事例も紹介」
動画生成
利用者の入力に対し、動画を生成する生成AIです。複数の画像を提示してその間を埋めるアニメーションを生成するもの、動画の入力に対し一部を差し替えた動画を作成するものなどがあります。
音声生成
生成するコンテンツが音源データとなる生成AIです。入力したテキストの読み上げ音声の生成、入力したイメージの音楽作成などに利用されます。
3Dモデル生成
生成するコンテンツが3Dモデルとなる生成AIです。3Dモデルとは、3次元のコンピュータグラフィックスを指しており、3Dゲームのグラフィック、3Dモデルのコンテンツ、各種の立体図面などで利用されています。入力にはテキストや1枚の画像を用いるものなどがあります。
生成AIの活用事例
生成AIの国内での具体的な活用事例を紹介します。マーケティング、プロモーション、デザインなど幅広い業務領域で利用されています。
paypayフリマ
paypayフリマでは、商品画像を入力として、その説明文を生成AIによって自動的に生成する仕組みを実装しました。利用者は説明文を作成する手間を大きく削減することができる利便性の高い機能となっています。
アサヒスーパードライの体験型プロモーション
アサヒビールでは、任意の画像とイメージテキストをインプットとしてオリジナルの画像を生成するサービスを体験型プロモーションとして提供しました。アニメ調、水彩画風などの指定が行え、利用者オリジナルのアートを提供してくれるサービスです。内部ではStable Diffusionを利用しています。
パナソニックコネクト
パナソニックホールディングスグループの事業会社パナソニックコネクトでは、従業員の業務をサポートする生成AI「ConnectAI」を導入しました。ConnectAIはChatGPTをベースとしたテキスト生成AIで、全従業員が利用できるサービスとしています。グループ内の展開や、サポートデスク業務での活用も検討しているとのことです。
各種生成AIの代表的ツール
各分野の生成AIの中でも人気のツールを紹介します。
サービス | 種類 | 特徴 | 類似人気サービス |
---|---|---|---|
ChatGPT | テキスト生成 | ・入力テキストに対し、チャットボットが回答 ・質問の回答、翻訳、要約、プログラミングなどで利用できる |
GPT-4、SAKUBUN、BingAI、Google Bart |
Stable Diffusion | 画像生成 | ・入力テキストに対応した画像を生成してくれる ・様々なサービスに組み込まれている |
Canva、Bing Image Craeter、Midjourney、Dall-E 2 |
Text-to-Speech AI | 音声・音楽生成 | AIを利用して、テキストを自然な音声に | JukeBox、Canva音楽生成AI |
Runway Gen-2 | 動画生成 | テキストから動画を生成する | Synthesia、GliaCloud |
Magic3D | 3Dモデル生成 | テキストから3Dモデルデータを生成する | DreamFusion、Point-E |
生成AIの将来展望
生成AIは登場から期間がそれほど経ってはいませんが、多くの企業が注力して新たなサービスが登場している分野です。今後の技術の進化と予測される将来の生成AIの進展について、関連情報を紹介します。
ChatGPTは音声入力や画像での入力への対応を開始
OpenAI社のChatGPTは生成AIの中でも人気のサービスです。テキストの入力からテキストの生成を行うサービスに加え、音声の入力、画像の入力、そして出力にも様々なパターンへの対応と機能を広げていっています。
ChatGPTの画像認識機能、音声認識機能については下記のブログで詳しく紹介しています。
➡「Chat GPTに新機能!画像と音声での入力に対応し、業務を効率化!?」
誰もが使いやすいユーザビリティを高めたサービスが今後も登場し続けることが予測できます。
また、これらの生成AIサービスは安定して提供されており、企業や組織では今後は導入・活用を積極的に検討することが必要でしょう。
法的な対応は遅れている?
生成AIは進歩の速度が速いサービスです。そして、入力情報を出力にも用いるため送信した情報が流出することなどもセキュリティ上の懸念点となります。関連して、著作権や肖像権の侵害なども起きる可能性があるでしょう。
日本国内でもインターネットガバナンスフォーラム2023京都にてAI特別セッションが設けられ、首相が出席・挨拶をするなど注目が高まってはいますが、法整備は追いついていないというのが多く見られる見解でしょう。生成AIの発展、利用拡大の足かせになり過ぎる法制度を避けつつ、安全な利用ができる法整備を今後も注視する必要があるでしょう。
まとめ
生成AIは生成するコンテンツの種類によって大きく分類されます。
- テキスト生成AI
- 画像生成AI
- 動画生成AI
- 音声・音楽生成AI
- 3Dモデル生成AI
求める生成物や入力方法によって、利用するサービスを選択することが重要です。
SMSデータテックでは、ChatGPT活用に関するセミナーを開催しています。
9/14に開催した初級編セミナーでは、ChatGPTがどういったものなのかいまひとつわからない、使ってみたいがどのように使ったらいいのか、どのように使うと効率的なのかわからない、そんな人のためにChatGPTの使い方のコツを一挙大公開しました。
➡セミナー内容はこちら
本記事を読んでさらにChatGPTについて知りたいと思った方は、ぜひこちらからお申込みいただき、アーカイブ動画をご覧ください。
おすすめイベント・セミナー 一覧へ
9月25日(水)に「【生成AI vs 生成AI】脅威にも対策にもなるって本当?」のセミナーを開催いたします。 生成AI あなたはこの言...
2024年9月10日(火)に、簡単にパワポを作成できる「パワポ生成AI」についてのセミナーを開催いたします。 8月9日に開催した同様の...