top of page

Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#2)

更新日:2月11日

前回のGoogle Colabの設定に続き、今回は、いよいよGooge GeminiというGoogleの生成系AIの導入です。Google Geminiとは、それまで、Google Bardと言われていた、Googleが提供する、生成系AIです。

Google Geminiって何?


もちろん、ChatGPT同様に、インターラクティブに質問することが可能です。画面の中央にある、「Chat with Gemini」を押してみましょう。


Google Geminiの事例
Google Geminiの事例(今年のスーパーボウルの勝敗予想を、スコアも含めて教えて?)

このように、見慣れた生成系AIの画面が用意されています。


Google Geminiを、Google Colabから操作しよう

さぁ、ここからは、このGoogle Geminiを使った、プログラミングの準備をしましょう。つまり、Google Colabから、Google Geminiに命令をして、AIをもっと活用しましょう。


まずは、Google Geminiを外部のプログラムから操作するための、API Keyを取得しましょう。利用制限はありますが、無料で、多くのことが行えるので、心配せずにAPI Keyを取得しましょう。


Google API Keyの取得


API Keyは、Google AI Studioというサイトで発行します。


Google API Key
Google API Key

この画面で、「Create API Key」を教えて、長い文字列のコードを取得します。このコードは大切ですので、他人には渡さずに、そして、これから使うので、メモしておきましょう。

といっても、コードなんだっけなと思ったら、発行後はコードの確認が可能なので、慌てなくて大丈夫です。


Google API Key検索画面
Google API Key検索画面

さて、ここまで準備ができたら、Google Colabに戻ります。前回と違う、別なノートを用意することにしましょう。


Google Colabの準備


最終的には、下記の画面のようなプログラミングを作りますが、皆さんが行うことは、Google Colabの画面に、このブログのテキストを、コピー&ペーストするだけなので、心配なく。


Googe ColabでのGooge Gemini プログラム例
Googe ColabでのGooge Gemini プログラム例

Google Geminiのパッケージのインストール


このプログラミング環境は、テキストとプログラミング・コードが共存できます。まずは、上部にある、「+テキスト」を押してみましょう。テキスト領域が登場するはずです。そこに、

パッケージのインストール。

と、入力してみましょう。もちろん、コピペで、大丈夫です。

次に、「+コード」を押して、プログラミング・コード領域を開けましょう。そして、

# パッケージのインストール
!pip install -q -U google-generativeai

と入力しましょう。

このプログラムは、Google Colabに、Google Geminiが使えるように準備するプログラムです。実行したくなりますが、まだ「三角」ボタンを押さずに、最後までプログラムを完成させましょう。


Markdown入力・出力モジュールのインストール

次に、テキスト領域には、

モジュールのインポート。
Markdown出力のユーティリティ関数も準備してます。

プログラミング領域には、

import pathlib
import textwrap
import google.generativeai as genai
from google.colab import userdata
from IPython.display import display
from IPython.display import Markdown

# Markdown出力
def to_markdown(text):
    text = text.replace("•", "  *")
    return Markdown(textwrap.indent(text, "> ", predicate=lambda _: True))

と入力します。


Google ColabへのGoogle API Keyの設定

ここだけ、少し他の操作があります。まず、画面左側のメニューから、「🔑」マークを探します。


Google Colabのシークレット設定画面
Google Colabのシークレット設定画面

この画面に入ると、下のように、環境変数を設定する画面が出てきます。


API Keyの設定
API Keyの設定

この画面で、名前の欄には、

GOOGLE_API_KEY

値の欄には、先ほど取得した、API Keyの長いフレーズを入力しましょう。

そして、最後に、「ノートブックからのアクセス」を、図のように、Onにしておきましょう。

次に、この画面を閉じて、Google Colabのメイン画面に戻り、テキストには、忘れないように、

GOOGLE_API_KEYの設定、なお、GOOGLE_API_KEYは、このコードに書くのではなく、左の"🔑" パネルに入力

と書いておきましょう。次に、コードの場所を新規に作成し、

# APIキーの準備
GOOGLE_API_KEY=userdata.get("GOOGLE_API_KEY")
genai.configure(api_key=GOOGLE_API_KEY)

と入力しましょう。


AIのモデルの準備

さぁ、プログラムも終盤です。次にテキスト欄に、

モデルの準備。

と入力。コード欄に、

# モデルの準備
model = genai.GenerativeModel('gemini-pro')

と入力しましょう。

なお、このモデルは、Gemini1.0では、3種類用意されています。

  • Gemini Ultra — 非常に複雑なタスクに対応する、高性能かつ最大のモデル

  • Gemini Pro — 幅広いタスクに対応する最良のモデル

  • Gemini Nano — デバイス上のタスクに最も効率的なモデル

詳しい情報は、Google Japan Blogの「最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに」を参照してください。


推論の実行させよう

さぁ、プログラムも仕上げです。テキスト欄に、

推論の実行。

と入力し、コード欄に、

# 推論の実行
response = model.generate_content("過去一番話題になったスーパーボウルを教えて?")
to_markdown(response.text)

と入力しましょう。これで、プログラミングは、終了です。


Google Colabで、Google Geminiを実行!

さぁ、あとは、プログラムの実行です。必ず、このプログラムの上から、下に、「三角」ボタンを順番に押して実行してみましょう。


ColabでGoogle Geminiを実行した例
ColabでGoogle Geminiを実行した例"過去一番話題になったスーパーボウルを教えて?"

実行すると、上記のように、Google Geminiの回答が出てくるはずです。


ちなみに、Google GeminiのWebサービスで、同じ質問をすると、回答が異なります。これは、このプログラムでは答えを一つにしている一方、Web版では、複数の回答が表示されるからです。もちろん、プログラミング・コードを変更すると、複数の回答も表示可能になりますが、これは、将来のBlogで。



過去一番話題になったスーパーボウルを教えて?
Google Geminiの回答例(過去一番話題になったスーパーボウルを教えて?)

次回の、「Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#3)」では、テキスト処理を卒業して、画像をGoogle Geminiに渡して、画像を文字で説明する推論を行なってみましょう。

閲覧数:354回0件のコメント
bottom of page