OpenAI社が「ChatGPT」をリリースして以来、世界的に生成AIが注目を集めています。ChatGPTに続き大きな話題を読んだのがGoogleの生成AI「Gemini」です。本記事ではGeminiとは何ができるのか、ChatGPTとはどこが違い、何がすごいのか、各モデルの特徴や料金まで詳しく解説します。
Gemini (ジェミニ) とは?
Gemini(ジェミニ)とは、Googleが開発した生成AI、および生成AIモデル名です。テキストだけではなく、画像、動画や音声、コードなども処理できる「マルチモーダル型」と呼ばれる生成AIに分類されます。
2023年12月に発表された、生成AIとしては比較的新しいモデルです。過去、Googleは「Bard(バード)」という対話型AIサービスをリリースしており、このサービスの基盤となっていたのがGeminiと名付けられた生成AIモデルでした。2024年2月には、サービス名とモデル名が統一され、どちらも「Gemini」と呼ばれるようになりました。
Geminiの強み
Geminiは生成AIを世に知らしめた「ChatGPT」と並び、生成AI分野を牽引する存在として世界中で注目を集めています。開発元は世界最大級の検索エンジンを運営するアメリカの大手IT企業・Google社です。GeminiではGoogleの膨大な検索結果を学習データとして用いているため、高精度な出力結果が得られます。また、Geminiでは生成精度や用途が異なる3つのモデルとして「Gemini Ultra」「Gemini Pro」「Gemini Nano」を用意しているのが特徴です。モデルごとの詳しい違いについては後述します。
GeminiとChatGPTの違い
生成AIを語る上で欠かせないのがChatGPTの存在です。GeminiとChatGPTはどちらもマルチモーダル型の生成AIですが、開発・リリース元が異なります。
ChatGPTを開発・リリースしているのはOpenAIというAI技術の開発を行っているアメリカの企業です。OpenAIはサム・アルトマン氏によって2015年に設立されました。もともとは非営利の研究機関として運営されていましたが、現在は非営利法人と営利法人からなるグループ組織として構成されています。
OpenAIはChatGPTにより一躍有名になりましたが、設立には世界的に著名な人物が数多く関わっているのも特徴です。例えば自動車のテスラ社やスペースX、SNSのXなどを手がけるイーロン・マスク氏が共同創業者として名を連ねているほか、ビジネス特化型SNSのLinkedInや決済システムのPayPalの共同創業者であるリード・ホフマン氏が出資し、取締役を務めていたことでも知られています。
ChatGPTについて詳しく知りたい方は、次の記事も参考にしてください。
【モデル別】Geminiの特徴
Geminiには大きく分けて3つのモデルが用意されており、それぞれ生成結果の精度や処理速度などが異なります。
1. Gemini Nano
「Gemini Nano」はGoogle製スマートフォン「Google Pixel 8Pro」やAndroid端末での使用に最適化したモデルとして設計されました。オンデバイスモデルという、デバイス上での実行・処理を行うモデルであり、応答速度が速いのが魅力です。インターネットに接続せず、アプリ内で返信提案やテキスト要約などを実行することで軽快な動作を実現しています。対象のスマートフォンを所持していれば無料で使用可能です。
2. Gemini Flash
「Gemini Flash」は、2024年5月にリリースされたGeminiの最軽量モデルです。後述する「Gemini 1.5 Pro」の改良とともにリリースされたモデルで、既存のGemini 1.5 Proの性能を維持しつつ高速化を実現しています。コンテキストウィンドウ(AIが一度に処理できる情報量)はGemini 1.5 proの1/2に当たる100万トークンですが、データ量をセーブすることで応答速度が格段に速くなっています。また、コストはGemini 1.5 Proの約1/10と低コスト化を実現しているのも特徴です。
無料でも利用できますが、機能や処理速度などに制限があります。無制限で使用したい場合は後述する有料プランへの加入が必要です。
3. Gemini Pro
「Gemini Pro」は、汎用性の高さを特徴としたモデルです。2024年2月には「Gemini 1.5 Pro」としてバージョンアップし、2024年5月にもアップデートがありました。新たなGemini 1.5 Proでは、コンテキストウィンドウが200万トークン以上に拡張しているのが特徴です。これはPDFファイルなら最大3,000ページ、メールであれば200通分に相当します。膨大なデータを一度で処理できる制度の高さと、高度な推論や創造的なタスクなど、幅広い分野に利用できる汎用性が持ち味です。
無料で使えるのはGemini Proで、利用回数や一度に処理できる情報量などに制限が設けられています。無制限で利用したい場合は有料プランへの加入が必要です。
4. Gemini Ultra
Gemini UltraはGeminiのシリーズ中、最大規模のモデルです。テキストをはじめ、画像、音声、動画、コードなどの様々な情報処理に対応しています。ほかのモデルに比べて専門性の高い分野でも高品質な出力ができるのが特徴で、ビジネスや研究、データ分析、高度なプログラミングコード生成などさまざまな目的で使われています。
Gemini Ultraを利用するには有料プランの加入が必須です。料金プランについては後ほど詳しく解説します。
Geminiの料金
Geminiの一部モデルや機能は有料です。Geminiでは無料モードと有料モード、及びビジネス向け有料モードを用意しており、それぞれ料金が異なります。
無料モード:Gemini
GeminiはGoogleアカウントを所持していれば誰でも利用可能です。Geminiの公式サイトにアクセスし、Googleのアカウント情報を入力するだけで利用開始できます。無料モードではテキスト生成、翻訳、要約などの基本的な機能が使えます。一部機能や処理速度などに制限があるため、画像生成、音声認識、API連携など、高度な機能を使用したい場合や、迅速な応答を求める場合は有料モードを検討しましょう。
有料モード:Gemini Advanced
Geminiの機能をフル活用したい場合は、Googleのサブスク型クラウドストレージサービス「Google One」のAIプレミアムプランに加入することで、Gemini Advancedが特典として利用できるようになります。」「Google One」のAIプレミアムプランは月額2,900円で、Gemini Ultraを含む全てのモデル・機能を利用可能です。また、最初の2カ月は無料で体験できます。
ほかの特典として2TBのストレージがセットになっているのもポイントです。Google One の2TBストレージ単体を契約する場合は1,300円かかるため、実質1,600円で有料版のGeminiを使用できる計算になります。
なお、年齢制限があり、18歳未満のユーザーは利用できないため注意してください。
ビジネス向け有料モード:Gemini Business/Gemini Enterprise
ビジネス用途で利用する場合は、 ビジネスに特化した有料モードが用意されています。契約するとGoogleのツール群をまとめたクラウド型のグループウェア「Google Workspace」とGeminiの最上位モデルのGemini Ultraを連携させて利用できるようになります。
さらに、AIチャットとしての利用以外に、Googleドキュメント、GmailなどGoogleのツール群と連携してGeminiを使用できるようになります。開発者向けのクラウドサービス「Google Cloud」にもGeminiを利用可能な環境がリリースされているので、必要に応じて利用可能です。
ビジネス向けの有料モードには、次の2つのプランがあります。
- Gemini Business:1ユーザーあたり月額2,260円(1年契約)
- Gemini Enterprise:1ユーザーあたり月額3,400円(1年契約)
Gemini Enterpriseは、Gemini Businessよりも高度な機能やサポートを提供するプランです。セキュリティやプライバシーに関する機能が強化されており、より大規模なビジネスでの利用に適しています。
Googleでは、入力されたデータがAI学習に利用されないよう、プライバシー保護に努めています。そのため、ビジネス向けの有料モードに加入している限り、外部に漏洩するのが望ましくないデータを入力してトラブルになる可能性は極めて低いでしょう。
なお、Google WorkspaceのGeminiは日本語に対応していますが、サイドパネル機能など一部は2024年9月以降の対応予定になっているため注意が必要です。
Geminiの使い方:利用開始の流れ
Geminiを使うにはGoogleアカウントが必要です。アカウントを持っていれば、誰でも簡単に登録、利用開始ができます。具体的な流れは次のとおりです。
- 公式サイトにアクセスし、[Geminiと話そう]をクリック
- 「利用規約とプライバシー」を最後まで閲覧し、[Geminiを使用]をクリック
- ポップアップされる「Gemini へようこそ」を閲覧し、[続ける]をクリック
- 手順3を完了させるとチャット入力欄が表示されるため、指示(プロンプト)などを入力して使用する
【活用例】Geminiができること:コンタクトセンター業務の効率化
生成AIのGeminiを活用すれば、企業のあらゆる業務を効率化できます。例えばコンタクトセンターでは、毎日届く多数の問い合わせメールに対する対応履歴を、オペレーターが要約して残す必要があります。
Geminiを活用すれば、メール内容を要約のプロンプトとともに入力するだけで、簡単に所定の形式で要約文を出力できます。
また、実際に返信する際も、メール内容と併せて返信文を作成するプロンプトを入力すれば、問い合わせに合った返信文が生成されます。不自然なところがないかチェックするだけで良いため、返信文を一から作成する手間を省けるのがメリットです。
なお、次の記事では実際にコンタクトセンターで要約や返信文の作成にGeminiを活用可能か検証しているので、ぜひ参考にしてください。
まとめ
Googleが手がける生成AIのGeminiには大きく分けて4つのモデルがあり、処理速度や汎用性の高さ、高性能などそれぞれ特徴があります。最上位モデル以外は、一部制限があるものの無料で利用が可能です。
また、ビジネス向けの有料モードはセキュリティやプライバシーに配慮されており、企業であっても安心して導入できます。Geminiを使えば文章、画像、動画や音声データに関するあらゆる業務を効率化可能です。まずはGeminiを体験し、生成AIの性能を実感してみましょう。
- TOPIC:
- 生成AI
- 関連キーワード:
- 生成AI
- 運用ノウハウ・ヒント