Brand pagetool

Ein Leitfaden zu Gemini Omni: Video, Character und Audio

Gemini Omni im Überblick: Multimodale Erstellung in Veo4 Studio

Gemini Omni ist das multimodale Erstellungsmodell von Google, das entwickelt wurde, um Inhalte aus verschiedenen Eingabearten zu generieren und zu bearbeiten. Beginnend mit Video ist die Omni-Familie darauf ausgelegt, komplexe kreative Workflows zu optimieren. Das erste Modell dieser Reihe, Gemini Omni Flash, unterstützt die praktische Videogenerierung und -bearbeitung und ermöglicht natürlichsprachliche Bearbeitungen, referenzbasierte Erstellung, Szenentransformation und kohärentes visuelles Storytelling.

In Veo4 Studio können Sie die Funktionen der Gemini Omni-Suite nutzen, um umfassende Medienprojekte zu erstellen. Hier ist ein Überblick über die Kernfunktionen – Video, Character und Audio – und wie man sie verwendet.

Gemini Omni Video

Gemini Omni Video konzentriert sich auf die Generierung und Änderung hochwertiger Videoinhalte mithilfe von Text- und Bildeingaben.

Vorteile:

  • Natürlichsprachliche Bearbeitung: Ändern Sie vorhandene Videoclips, indem Sie einfach eingeben, was Sie ändern möchten.
  • Referenzbasierte Erstellung: Verwenden Sie ein Bild oder ein anderes Video als stilistische oder strukturelle Referenz.
  • Szenentransformation: Ändern Sie die Umgebung oder Tageszeit in einer Szene, ohne das Hauptmotiv zu verlieren.
  • Kohärentes visuelles Storytelling: Behalten Sie die visuelle Konsistenz über mehrere generierte Aufnahmen hinweg bei.

So verwenden Sie es:

  1. Navigieren Sie zu Ihrem Dashboard und wählen Sie das Tool zur Videogenerierung aus.
  2. Geben Sie einen beschreibenden Text-Prompt ein oder laden Sie ein Referenzbild hoch.
  3. Laden Sie zur Bearbeitung ein Basisvideo hoch und verwenden Sie das Prompt-Feld, um Ihre Änderungen anzugeben (z. B. „Hintergrund in einen Winterwald ändern“).
  4. Konsultieren Sie unseren Prompt-Guide für Tipps zur Strukturierung Ihrer Videoanfragen.

Gemini Omni Character

Gemini Omni Character wurde entwickelt, um die Herausforderung zu lösen, die Charakterkonsistenz über verschiedene Szenen und Blickwinkel hinweg in der generativen KI aufrechtzuerhalten.

Vorteile:

  • Identitätsbewahrung: Halten Sie Gesichtszüge, Kleidung und Proportionen über mehrere Generierungen hinweg konsistent.
  • Flexibles Posing: Generieren Sie denselben Charakter in verschiedenen Aktionen und Umgebungen.
  • Stilanpassungsfähigkeit: Wenden Sie verschiedene Kunststile an und behalten Sie gleichzeitig die Kernidentität des Charakters bei.

So verwenden Sie es:

  1. Laden Sie ein klares Referenzbild Ihres Motivs in das Character-Modul in Ihrem Dashboard hoch.
  2. Definieren Sie die Kernmerkmale des Charakters im System-Prompt.
  3. Generieren Sie neue Szenen, indem Sie in Ihren Text-Prompts auf das gespeicherte Charakterprofil verweisen.

Gemini Omni Audio

Zur Ergänzung der visuellen Generierung bietet Gemini Omni Audio eine integrierte Tonerstellung, mit der Sie Audiospuren generieren können, die zu Ihrer Videoausgabe passen.

Vorteile:

  • Kontextbezogene Klanglandschaften: Generieren Sie Umgebungsgeräusche und Soundeffekte, die direkt zum visuellen Kontext Ihres Videos passen.
  • Synchronisierte Generierung: Erstellen Sie Audiospuren, die auf das Tempo Ihrer generierten Szenen abgestimmt sind.
  • Multimodale Eingabe: Verwenden Sie Text-Prompts, um die genaue Audiostimmung oder die erforderlichen Soundeffekte zu definieren.

So verwenden Sie es:

  1. Wählen Sie nach der Generierung eines Videoclips die Registerkarte Audiogenerierung aus.
  2. Geben Sie einen Text-Prompt ein, der den gewünschten Ton beschreibt (z. B. „belebte Stadtstraße mit fernen Sirenen“).
  3. Wenden Sie die generierte Audiospur direkt auf Ihre Video-Timeline an.

Erste Schritte

Die Gemini Omni-Suite bietet einen einheitlichen Ansatz zur multimodalen Inhaltserstellung. Durch die Kombination von Video-, Character- und Audio-Workflows können Sie vollständige Erzählungen über eine einzige Schnittstelle erstellen.

Um mit diesen Modellen zu experimentieren, rufen Sie Ihr Dashboard auf. Weitere detaillierte Tutorials finden Sie in unserem Lernzentrum oder kontaktieren Sie uns für Support.