Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#2)

更新日：2月11日

前回のGoogle Colabの設定に続き、今回は、いよいよGooge GeminiというGoogleの生成系AIの導入です。Google Geminiとは、それまで、Google Bardと言われていた、Googleが提供する、生成系AIです。

Google Geminiって何？

もちろん、ChatGPT同様に、インターラクティブに質問することが可能です。画面の中央にある、「Chat with Gemini」を押してみましょう。

Google Geminiの事例（今年のスーパーボウルの勝敗予想を、スコアも含めて教えて？）

このように、見慣れた生成系AIの画面が用意されています。

Google Geminiを、Google Colabから操作しよう

さぁ、ここからは、このGoogle Geminiを使った、プログラミングの準備をしましょう。つまり、Google Colabから、Google Geminiに命令をして、AIをもっと活用しましょう。

まずは、Google Geminiを外部のプログラムから操作するための、API Keyを取得しましょう。利用制限はありますが、無料で、多くのことが行えるので、心配せずにAPI Keyを取得しましょう。

Google API Keyの取得

API Keyは、Google AI Studioというサイトで発行します。

この画面で、「Create API Key」を教えて、長い文字列のコードを取得します。このコードは大切ですので、他人には渡さずに、そして、これから使うので、メモしておきましょう。

といっても、コードなんだっけなと思ったら、発行後はコードの確認が可能なので、慌てなくて大丈夫です。

さて、ここまで準備ができたら、Google Colabに戻ります。前回と違う、別なノートを用意することにしましょう。

Google Colabの準備

最終的には、下記の画面のようなプログラミングを作りますが、皆さんが行うことは、Google Colabの画面に、このブログのテキストを、コピー＆ペーストするだけなので、心配なく。

Google Geminiのパッケージのインストール

このプログラミング環境は、テキストとプログラミング・コードが共存できます。まずは、上部にある、「+テキスト」を押してみましょう。テキスト領域が登場するはずです。そこに、

パッケージのインストール。

と、入力してみましょう。もちろん、コピペで、大丈夫です。

次に、「＋コード」を押して、プログラミング・コード領域を開けましょう。そして、

# パッケージのインストール
!pip install -q -U google-generativeai

と入力しましょう。

このプログラムは、Google Colabに、Google Geminiが使えるように準備するプログラムです。実行したくなりますが、まだ「三角」ボタンを押さずに、最後までプログラムを完成させましょう。

Markdown入力・出力モジュールのインストール

次に、テキスト領域には、

モジュールのインポート。
Markdown出力のユーティリティ関数も準備してます。

プログラミング領域には、

import pathlib
import textwrap
import google.generativeai as genai
from google.colab import userdata
from IPython.display import display
from IPython.display import Markdown

# Markdown出力
def to_markdown(text):
    text = text.replace("•", "  *")
    return Markdown(textwrap.indent(text, "> ", predicate=lambda _: True))

と入力します。

Google ColabへのGoogle API Keyの設定

ここだけ、少し他の操作があります。まず、画面左側のメニューから、「🔑」マークを探します。

この画面に入ると、下のように、環境変数を設定する画面が出てきます。

この画面で、名前の欄には、

GOOGLE_API_KEY

値の欄には、先ほど取得した、API Keyの長いフレーズを入力しましょう。

そして、最後に、「ノートブックからのアクセス」を、図のように、Onにしておきましょう。

次に、この画面を閉じて、Google Colabのメイン画面に戻り、テキストには、忘れないように、

GOOGLE_API_KEYの設定、なお、GOOGLE_API_KEYは、このコードに書くのではなく、左の"🔑" パネルに入力

と書いておきましょう。次に、コードの場所を新規に作成し、

# APIキーの準備
GOOGLE_API_KEY=userdata.get("GOOGLE_API_KEY")
genai.configure(api_key=GOOGLE_API_KEY)

と入力しましょう。

AIのモデルの準備

さぁ、プログラムも終盤です。次にテキスト欄に、

モデルの準備。

と入力。コード欄に、

# モデルの準備
model = genai.GenerativeModel('gemini-pro')

と入力しましょう。

なお、このモデルは、Gemini1.0では、３種類用意されています。

Gemini Ultra — 非常に複雑なタスクに対応する、高性能かつ最大のモデル
Gemini Pro — 幅広いタスクに対応する最良のモデル
Gemini Nano — デバイス上のタスクに最も効率的なモデル

詳しい情報は、Google Japan Blogの「最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに」を参照してください。

推論の実行させよう

さぁ、プログラムも仕上げです。テキスト欄に、

推論の実行。

と入力し、コード欄に、

# 推論の実行
response = model.generate_content("過去一番話題になったスーパーボウルを教えて？")
to_markdown(response.text)

と入力しましょう。これで、プログラミングは、終了です。

Google Colabで、Google Geminiを実行！

さぁ、あとは、プログラムの実行です。必ず、このプログラムの上から、下に、「三角」ボタンを順番に押して実行してみましょう。

ColabでGoogle Geminiを実行した例"過去一番話題になったスーパーボウルを教えて？"

実行すると、上記のように、Google Geminiの回答が出てくるはずです。

ちなみに、Google GeminiのWebサービスで、同じ質問をすると、回答が異なります。これは、このプログラムでは答えを一つにしている一方、Web版では、複数の回答が表示されるからです。もちろん、プログラミング・コードを変更すると、複数の回答も表示可能になりますが、これは、将来のBlogで。

Google Geminiの回答例(過去一番話題になったスーパーボウルを教えて？)

次回の、「Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#3)」では、テキスト処理を卒業して、画像をGoogle Geminiに渡して、画像を文字で説明する推論を行なってみましょう。

マーケティングサイエンスラボ

Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#2)

Google Geminiって何？

Google Geminiを、Google Colabから操作しよう

Google API Keyの取得

Google Colabの準備

Google Geminiのパッケージのインストール

Markdown入力・出力モジュールのインストール

Google ColabへのGoogle API Keyの設定

AIのモデルの準備

推論の実行させよう

Google Colabで、Google Geminiを実行！

最新記事

(C) 株式会社マーケティングサイエンスラボ