前回のGoogle Colabの設定に続き、今回は、いよいよGooge GeminiというGoogleの生成系AIの導入です。Google Geminiとは、それまで、Google Bardと言われていた、Googleが提供する、生成系AIです。
Google Geminiって何?
もちろん、ChatGPT同様に、インターラクティブに質問することが可能です。画面の中央にある、「Chat with Gemini」を押してみましょう。

このように、見慣れた生成系AIの画面が用意されています。
Google Geminiを、Google Colabから操作しよう
さぁ、ここからは、このGoogle Geminiを使った、プログラミングの準備をしましょう。つまり、Google Colabから、Google Geminiに命令をして、AIをもっと活用しましょう。
まずは、Google Geminiを外部のプログラムから操作するための、API Keyを取得しましょう。利用制限はありますが、無料で、多くのことが行えるので、心配せずにAPI Keyを取得しましょう。
Google API Keyの取得
API Keyは、Google AI Studioというサイトで発行します。

この画面で、「Create API Key」を教えて、長い文字列のコードを取得します。このコードは大切ですので、他人には渡さずに、そして、これから使うので、メモしておきましょう。
といっても、コードなんだっけなと思ったら、発行後はコードの確認が可能なので、慌てなくて大丈夫です。

さて、ここまで準備ができたら、Google Colabに戻ります。前回と違う、別なノートを用意することにしましょう。
Google Colabの準備
最終的には、下記の画面のようなプログラミングを作りますが、皆さんが行うことは、Google Colabの画面に、このブログのテキストを、コピー&ペーストするだけなので、心配なく。

Google Geminiのパッケージのインストール
このプログラミング環境は、テキストとプログラミング・コードが共存できます。まずは、上部にある、「+テキスト」を押してみましょう。テキスト領域が登場するはずです。そこに、
パッケージのインストール。
と、入力してみましょう。もちろん、コピペで、大丈夫です。
次に、「+コード」を押して、プログラミング・コード領域を開けましょう。そして、
# パッケージのインストール
!pip install -q -U google-generativeai
と入力しましょう。
このプログラムは、Google Colabに、Google Geminiが使えるように準備するプログラムです。実行したくなりますが、まだ「三角」ボタンを押さずに、最後までプログラムを完成させましょう。
Markdown入力・出力モジュールのインストール
次に、テキスト領域には、
モジュールのインポート。
Markdown出力のユーティリティ関数も準備してます。
プログラミング領域には、
import pathlib
import textwrap
import google.generativeai as genai
from google.colab import userdata
from IPython.display import display
from IPython.display import Markdown
# Markdown出力
def to_markdown(text):
text = text.replace("•", " *")
return Markdown(textwrap.indent(text, "> ", predicate=lambda _: True))
と入力します。
Google ColabへのGoogle API Keyの設定
ここだけ、少し他の操作があります。まず、画面左側のメニューから、「🔑」マークを探します。

この画面に入ると、下のように、環境変数を設定する画面が出てきます。

この画面で、名前の欄には、
GOOGLE_API_KEY
値の欄には、先ほど取得した、API Keyの長いフレーズを入力しましょう。
そして、最後に、「ノートブックからのアクセス」を、図のように、Onにしておきましょう。
次に、この画面を閉じて、Google Colabのメイン画面に戻り、テキストには、忘れないように、
GOOGLE_API_KEYの設定、なお、GOOGLE_API_KEYは、このコードに書くのではなく、左の"🔑" パネルに入力
と書いておきましょう。次に、コードの場所を新規に作成し、
# APIキーの準備
GOOGLE_API_KEY=userdata.get("GOOGLE_API_KEY")
genai.configure(api_key=GOOGLE_API_KEY)
と入力しましょう。
AIのモデルの準備
さぁ、プログラムも終盤です。次にテキスト欄に、
モデルの準備。
と入力。コード欄に、
# モデルの準備
model = genai.GenerativeModel('gemini-pro')
と入力しましょう。
なお、このモデルは、Gemini1.0では、3種類用意されています。
Gemini Ultra — 非常に複雑なタスクに対応する、高性能かつ最大のモデル
Gemini Pro — 幅広いタスクに対応する最良のモデル
Gemini Nano — デバイス上のタスクに最も効率的なモデル
詳しい情報は、Google Japan Blogの「最大かつ高性能 AI モデル、Gemini を発表 - AI をすべての人にとってより役立つものに」を参照してください。
推論の実行させよう
さぁ、プログラムも仕上げです。テキスト欄に、
推論の実行。
と入力し、コード欄に、
# 推論の実行
response = model.generate_content("過去一番話題になったスーパーボウルを教えて?")
to_markdown(response.text)
と入力しましょう。これで、プログラミングは、終了です。
Google Colabで、Google Geminiを実行!
さぁ、あとは、プログラムの実行です。必ず、このプログラムの上から、下に、「三角」ボタンを順番に押して実行してみましょう。

実行すると、上記のように、Google Geminiの回答が出てくるはずです。
ちなみに、Google GeminiのWebサービスで、同じ質問をすると、回答が異なります。これは、このプログラムでは答えを一つにしている一方、Web版では、複数の回答が表示されるからです。もちろん、プログラミング・コードを変更すると、複数の回答も表示可能になりますが、これは、将来のBlogで。

次回の、「Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#3)」では、テキスト処理を卒業して、画像をGoogle Geminiに渡して、画像を文字で説明する推論を行なってみましょう。
Comments