Gemini Omni ガイド：ビデオ、キャラクター、オーディオ

Gemini Omni の探索：Veo4 Studio におけるマルチモーダル制作

Gemini Omni は、さまざまな種類の入力からコンテンツを生成および編集するために構築された、Google のマルチモーダル制作モデルです。ビデオを皮切りに、Omni ファミリーは複雑なクリエイティブワークフローを合理化するように設計されています。このラインナップの最初のモデルである Gemini Omni Flash は、実用的なビデオ生成と編集をサポートし、自然言語による編集、リファレンスベースの制作、シーンの変換、一貫した視覚的ストーリーテリングを可能にします。

Veo4 Studio では、Gemini Omni スイートの機能を活用して、包括的なメディアプロジェクトを構築できます。ここでは、コア機能（ビデオ、キャラクター、オーディオ）の概要とその使用方法を紹介します。

Gemini Omni Video（ビデオ）

Gemini Omni Video は、テキストや画像の入力を使用して、高品質なビデオコンテンツを生成および変更することに焦点を当てています。

利点：

自然言語による編集： 変更したい内容を入力するだけで、既存のビデオクリップを変更できます。
リファレンスベースの制作： 画像や別のビデオを、スタイルや構造の参照として使用します。
シーンの変換： 主要な被写体を失うことなく、シーンの環境や時間帯を変更します。
一貫した視覚的ストーリーテリング： 生成された複数のショット間で視覚的な一貫性を維持します。

使用方法：

ダッシュボードに移動し、ビデオ生成ツールを選択します。
説明的なテキストプロンプトを入力するか、参照画像をアップロードします。
編集する場合は、ベースとなるビデオをアップロードし、プロンプトボックスを使用して変更を指定します（例：「背景を冬の森に変更する」）。
ビデオリクエストの構成に関するヒントについては、プロンプトガイドを参照してください。

Gemini Omni Character（キャラクター）

Gemini Omni Character は、生成 AI における一般的な課題である、異なるシーンや角度にわたってキャラクターの一貫性を維持するという問題を解決するように設計されています。

利点：

アイデンティティの保持： 複数回の生成にわたって、顔の特徴、服装、プロポーションを一定に保ちます。
柔軟なポージング： さまざまなアクションや環境で同じキャラクターを生成します。
スタイルの適応性： キャラクターのコアとなるアイデンティティを保持しながら、異なるアートスタイルを適用します。

使用方法：

ダッシュボードのキャラクターモジュールに、被写体の鮮明な参照画像をアップロードします。
システムプロンプトでキャラクターのコアな特徴を定義します。
テキストプロンプトで保存したキャラクタープロファイルを参照して、新しいシーンを生成します。

Gemini Omni Audio（オーディオ）

視覚的な生成を補完するために、Gemini Omni Audio は統合されたサウンド作成機能を提供し、ビデオ出力に一致するオーディオトラックを生成できるようにします。

利点：

コンテキストに沿ったサウンドスケープ： ビデオの視覚的なコンテキストに直接一致する環境音や効果音を生成します。
同期された生成： 生成されたシーンのペースに合わせて設計されたオーディオトラックを作成します。
マルチモーダル入力： テキストプロンプトを使用して、必要な正確なオーディオの雰囲気や効果音を定義します。

使用方法：

ビデオクリップを生成した後、オーディオ生成タブを選択します。
目的のサウンドを説明するテキストプロンプトを入力します（例：「遠くでサイレンが鳴っている賑やかな街の通り」）。
生成されたオーディオトラックをビデオタイムラインに直接適用します。

はじめに

Gemini Omni スイートは、マルチモーダルコンテンツ制作への統一されたアプローチを提供します。ビデオ、キャラクター、オーディオのワークフローを組み合わせることで、単一のインターフェースから完全なストーリーを構築できます。

これらのモデルの試用を開始するには、ダッシュボードにアクセスしてください。より詳細なチュートリアルについては、ラーニングセンターをご覧いただくか、サポートについてお問い合わせください。