衝撃!Google Geminiが「Veo3」で動画生成!実際に使ってみたら未来が見えた
- 本間 充/マーケティングサイエンスラボ所長
- 7月11日
- 読了時間: 4分
Google Geminiで[Veo3]が使えるようになったので、早速やってみました。
Google Geminiの画面に、「動画」というアイコンが増えてています。

これは、Google 動画生成AI「Veo3」という機能です。早速使ってみました。
動画のシナリオもGeminiに相談
まずは、動画のシナリオを考えないといけません。そこで、Geminiに、以下のようにまず相談です。
お店での買い物の時にスマートフォンで情報を見ながら、さらにSNSやAIを使っているシーンの動画を6秒程度のショートムービーで作りたいです。
シナリオと、ふさわしい音楽のイメージを考えてください。
視聴者は、ビジネスパーソンです。すると、Geminiからショートムービーのシナリオが出力されました。
ショートムービー シナリオ:スマートショッピングの未来
ターゲット視聴者: ビジネスパーソン
動画時間: 6秒
コンセプト: スマートフォンを活用し、SNSやAIを駆使して効率的かつパーソナライズされたショッピング体験をする現代のビジネスパーソンの姿を描く。
シナリオ
シーン1 (0-2秒):
スタイリッシュなビジネスパーソン(30代男性)が、カフェ併設のセレクトショップで商品棚を見ています。
右手にはスマートフォン。画面には商品の詳細情報(素材、ブランドストーリーなど)がAR表示されているようなイメージ。
背景には、シンプルながらも洗練された店内の様子が映り込みます。
(以下略)このシナリオを確認して、再度、Google Geminiに入力して、今度が、動画ボタンを押して、しばし待ちます。
Google Veo3が作成した動画はこちら
3,4分程度待ったでしょうか。以下が完成した動画です。私が、まだVeo3への上手な指示の方法を理解していないので、多少問題はありますが、概ねイメージ通りの動画です。
皆さん、どうでしょうか。まず驚きは、いっさい実際の撮影をすることなく、ここまで動画が作れるのですね。それがまず驚きです。

Google Veo3の特徴
Google Veo3には、以下のような特徴があるそうです。ぜひ、皆さんも特徴を理解して、試してみてください。ビジネスのプレゼンテーションで、Videoが必要な時もあるでしょうからね。
テキストから高品質な動画を生成
簡単な文章(プロンプト)を入力するだけで、最大1080pの高画質な動画を生成できます。
「夕暮れのビーチを歩くカップル」のような簡単な指示から、より複雑なストーリーまで映像化します。
映像と音声を同時に生成
Veo3の最も革新的な機能の一つです。映像だけでなく、そのシーンに合ったセリフ、効果音、BGM、環境音などを同時に作り出します。
人物の口の動きとセリフを合わせるリップシンクにも対応しており、自然な会話シーンを作成できます。
多彩な映像スタイルに対応
プロンプトで指示することで、実写風、アニメ風、ファンタジー風など、様々なスタイルの動画を生成可能です。
映画のようなカメラワークを指示
「ズームイン」「ドリーショット(被写体に近づく動き)」「パン(カメラを左右に振る)」といった、専門的なカメラの動きをプロンプトで細かくコントロールできます。
キャラクターや世界観の一貫性を維持
複数のシーンにわたって、同じキャラクターや物体の一貫性を保ったまま動画を生成することができます。
物理法則の理解
物の動きや光の当たり方など、現実世界の物理法則を理解しているため、非常にリアルで自然な映像を生成します。
動画の編集・加工
生成した動画のフレームを拡張する「アウトペインティング」や、動画内の一部の物体を追加・削除するといった高度な編集も可能です。
安全性への配慮
生成された動画には、AIによって作られたことを示す電子透かし「SynthID」が埋め込まれ、フェイク動画対策が施されています。
今までは、ナレーションは、AIで作成していたのですが、もっと様々なことができそうです。
参考記事:AIを使ってVideoを作成してみた!
