top of page

Google Colabで、Google Gemini(AI)のプログラミング解説、初心者用(#18)/Google Geminiで、動画や音声の分析が可能になったよ!

生成AIの競争が熾烈ですね!

2024年5月は、生成AIの様々な発表がありましたね。


5/20には、マイクロソフトが、「Coploto+PC」(コパイロットプラスピーシー)という、AIのために設計されたWindows PCの発表がありました。


それに先駆けて、Googleは、5/14に「Google I/O」という開発か会議で、は人工知能(AI)関連の発表を様々行いました。



このように、これからも人工知能(AI)、生成AIに関する、ニュースが続くのでしょう。


Google Gemini 1.5が使えるようになり、動画や音声の分析が可能に

さて、そのような中、Google AI Studioでも、Gemini 1.5がプレビュー版として使えるように、なっています。詳細情報は、Google for Developwesの、「Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場」を参照してください。


そこで、本当に、Geminiで動画の分析が可能なのか、サンプル動画で試してみたいと思います。

まずは、Google AI Studioにアクセスしてみましょう。すると、右側のModelのメニューの中に、Gemini 1.5 Flash LatestとGemini 1.5 Pro Latestが追加されているはずです。

Geminiのモデル
Geminiのモデル

ちなみに、Flashとついている、Geminiのモデルは、「Our lightweight model, optimized for speed and efficiency」と説明されているように、軽く、高速に安価に分析できるモデルのようです。詳細は、「Gemini Flash」のページにそれぞれのモデルの比較が掲載されているので、確認してみてください。


ここでは、Gemini 1.5 Pro Latestを選び、先に進むことにしましょう。


プロンプトの入力の横の「+」マークを押すと、「Sample Video」があるので、選んでみましょう。

プロンプトからVideo入力
プロンプトからVideo入力

すると、Google AI Studioに用意されている、サンプルの動画がいくつか用意されています。

まぁ、どの動画を選んでも良いのですが、最初の動画を選び、プロンプト欄に、「このVideoの要約を教えてください。」と入力してみましょう。

Google AI Studioに用意されているサンプル動画
Google AI Studioに用意されているサンプル動画
動画の要約をするプロンプト
動画の要約をするプロンプト

この動画は、表示もあるように、約44分ある映像です。しかし、このプロンプトで、Geminiに動画分析させると、私の場合では、61秒で、要約が回答されました。

Google Geminiによる動画の要約
Google Geminiによる動画の要約

動画の要約は、会社の会議の議事録作成や、授業のポイント理解に使われそう

このGeminiの動画分析がどの程度正確かは、様々な実証で理解されることになるでしょう。が、この機能を使うと、会社の会議の議事録作成や、教育現場の授業のポイント整理などに使われそうです。まさに、タイム・パーフォーマンス向上の機能です。


この前までは、「ハリー・ポッターとアズカバンの囚人」に於いて登場人物のハーマイオニー・グレンジャーが時間を逆転させる時計「タイムターナー」を用いて同じ時間に複数の科目を受けていたのを、羨ましく思っていたのですが、別な手法で、効率よく授業を受けられるようになりそうですね。


まぁ、そんなことして良いのかは、これから、私たちのコンセンスを得るプロセスが必要ですが。



閲覧数:83回0件のコメント

Comments


bottom of page