【未来の動画制作】日本語で喋るAI動画が作れた!Googleの最新AI「Veo3」をAI Studioで試した全記録
- 本間 充/マーケティングサイエンスラボ所長
- 7月22日
- 読了時間: 6分
「アイデアはあるのに、動画で表現するスキルがない…」 「クリエイティブな映像を作りたいけど、機材も時間も足りない…」
そんな悩みを抱えるすべてのクリエイター、そして未来のクリエイターに朗報です。Googleが発表した最新の動画生成AI「Veo3」が、私たちの創作活動を根底から変えようとしています。
文章(プロンプト)を入力するだけで、まるで映画のような高品質な動画を生成できる。そんな夢のような話が、今、現実のものとなりました。
今回は、GoogleのAI開発プラットフォーム「AI Studio」で公開された「Veo3」の驚くべき機能、特に「音声付き動画」の生成、そして日本語でのナレーション生成は可能なのか、実際に試した結果を詳しくレポートします。
革命的な動画生成AI「Google Veo3」とは?
Googleが開発した「Veo3」は、テキストや画像から高品質な動画を生成する最先端のAIモデルです。その特徴は、単に映像を作るだけにとどまりません。
高解像度・長尺生成: 1080pを超える高解像度で、1分以上の長尺動画を生成可能。短いクリップのつなぎ合わせではない、一貫性のあるストーリーを描き出します。
指示への高い忠実性: 「夕暮れの海岸をドローンで空撮したような映像」といった具体的なカメラワークや、「ストップモーションアニメ風」といった映像のトーンやスタイルまで、プロンプトの細かなニュアンスを驚くほど正確に反映します。
自然で一貫性のある動き: 生成される人物や動物、物体の動きは非常に滑らかで、映像全体を通して矛盾のない、リアルな世界観を保ち続けます。
そして、「Veo3」が持つ最大級のインパクトが、今回フォーカスする「音声付き動画」の生成機能です。映像だけでなく、そのシーンに合った効果音やBGM、さらにはナレーションまでAIが自動で生成してくれるのです。これは、映像制作のワークフローを劇的に変える可能性を秘めています。
日本語ナレーション付き動画は生成できるのか?実際に試してみた
AI Studioでは、Veo3の性能を体験できるサンプルプロンプトがいくつか公開されています。その中の一つに、https://aistudio.google.com/apps/bundled/veo3_gallery で見ることができる「Fluffy Characters Stop Motion」という、可愛らしいキャラクターが登場するストップモーションアニメ風のサンプルがあります。
このサンプルの元々のプロンプトは英語で書かれており、生成される動画のナレーションも当然ながら英語です。

ここで、私たちの中に一つの疑問が湧きました。 「これを日本語のプロンプトに書き換えれば、日本語のナレーションが付いた動画を生成できるのではないか?」
もしこれが可能なら、日本のユーザーにとってVeo3の価値は計り知れないものになります。アニメーション、製品紹介、教育コンテンツなど、日本語のナレーションが必須となるあらゆるシーンで、このAIが活躍できることになるからです。
早速、私たちは元のプロンプトの意図を汲み取り、日本語で新たなプロンプトを作成。キャラクターの動きや世界観、そして何より「日本語で語りかけるナレーション」が含まれるように指示を組み立て、生成ボタンをクリックしました。
緊張の一瞬の後、画面に映し出された結果は…
ふわふわキャラクターのストップモーション(日本語のセリフで)
舞台は、フェルトと毛糸でできた色鮮やかで居心地のいいキッチン。大きすぎるメガネをかけた、まるまると太ったふわふわのハムスター、ニブルス教授が、ミニチュアのコンロでぐつぐつと泡立つ鍋を神経質そうにかき混ぜている。「レシピには…『風味の素』を、あとほんの少し…」とつぶやきながら。カメラは、彼が必死にかき混ぜる様子をミッドショットで捉えている。
突如、鍋が「ポン!」という大きな音を立て、続いて「シュコーッ!」というコミカルな音が響き、虹色に輝く緑のスライムが間欠泉のように噴き出してキッチン全体を覆い尽くす。
ニブルス教授は「なんてこった!またか!」と甲高い声をあげ、パニックで「キュー、キュー」と鳴きながらちょこまかと逃げ去っていくのだった。見事、成功しました!
生成された動画には、私たちが指示した通りのストップモーション風のアニメーションと共に、非常に流暢な日本語のナレーションが加えられていました。発音の自然さ、感情の込め方、どれをとっても現在のAI技術の進化をまざまざと見せつけられるクオリティです。
今回の実験で、Veo3が多言語に対応しており、プロンプトの言語に応じてナレーション言語を使い分ける高度な能力を持っていることが証明されました。これは、グローバルなコンテンツ制作のハードルを大きく下げる、画期的な一歩と言えるでしょう。
Veo3を試すには?(利用上の注意点)
「自分も今すぐ試してみたい!」と思われた方も多いかもしれません。
しかし、2024年7月現在、この最先端の機能を試すには、Google AI Studioの有料プランに登録し、課金が可能な状態である必要があります。
まだ誰もが気軽に無料で使える段階ではありませんが、この技術がもたらす未来をいち早く体験したいクリエイターや開発者にとっては、投資する価値のある先行体験と言えるでしょう。今後、より多くの人が利用できるようになることを期待したいところです。
創造性の新時代へ。Geminiが拓くクリエイティブの無限の可能性
Googleの挑戦は、Veo3による動画生成だけにとどまりません。AI Studioでは、クリエイターのあらゆるニーズに応える、多彩な生成AIツールが提供されています。
例えば、「Prompt DJ for MIDI (https://aistudio.google.com/apps/bundled/promptdj-midi)」というツールがあります。これは、テキストプロンプトからMIDI形式の音楽データを生成するAIです。「悲しい雰囲気のピアノ曲」や「80年代風のシンセポップ」といった指示だけで、オリジナルのメロディーや伴奏のアイデアを得ることができます。

このように、動画、画像、音声、音楽といったクリエイティブの核となる要素を、誰もがAIの力を借りて生み出せる時代が到来しつつあります。
映像監督が、頭の中のイメージをVeo3で即座に具現化し、チームと共有する。
ミュージシャンが、Prompt DJ for MIDIで得たメロディーを元に、新たな楽曲を生み出す。
小説家が、自らの物語の世界観をAIでビジュアル化し、読者に新しい体験を提供する。
Geminiを中核とするGoogleの生成AIは、専門的なスキルや高価な機材の壁を取り払い、アイデアさえあれば誰もがトップクリエイターになれる可能性を秘めた、まさに「創造性の民主化」を実現しようとしています。
まとめ
今回、GoogleのVeo3が日本語のプロンプトから音声付き動画を生成できることを確認し、その計り知れないポテンシャルを実感しました。まだ発展途上の技術ではありますが、私たちの創作活動に革命をもたらす力があることは間違いありません。
今はまだ一部のユーザーしか触れることのできない最先端技術ですが、近い将来、この力が広く解放された時、世界はどのような素晴らしいクリエイティブで満たされるのでしょうか。
その未来の片鱗に、今から触れてみてはいかがでしょうか。
