Brand pagetool

Guia do Gemini Omni: Vídeo, Personagem e Áudio

Explorando o Gemini Omni: Criação Multimodal no Veo4 Studio

O Gemini Omni é o modelo de criação multimodal do Google criado para gerar e editar conteúdo a partir de vários tipos de entradas. Começando com o vídeo, a família Omni foi projetada para otimizar fluxos de trabalho criativos complexos. O primeiro modelo desta linha, o Gemini Omni Flash, suporta a geração e edição prática de vídeo, permitindo edições em linguagem natural, criação baseada em referências, transformação de cenas e narrativa visual coerente.

No Veo4 Studio, você pode aproveitar os recursos da suíte Gemini Omni para criar projetos de mídia abrangentes. Aqui está uma visão geral dos principais recursos (Vídeo, Personagem e Áudio) e como usá-los.

Gemini Omni Video

O Gemini Omni Video se concentra na geração e modificação de conteúdo de vídeo de alta qualidade usando entradas de texto e imagem.

Vantagens:

  • Edições em Linguagem Natural: Modifique clipes de vídeo existentes simplesmente digitando o que você deseja alterar.
  • Criação Baseada em Referência: Use uma imagem ou outro vídeo como referência estilística ou estrutural.
  • Transformação de Cena: Altere o ambiente ou a hora do dia em uma cena sem perder o assunto principal.
  • Narrativa Visual Coerente: Mantenha a consistência visual em várias tomadas geradas.

Como usar:

  1. Navegue até o seu Painel e selecione a ferramenta de geração de Vídeo.
  2. Insira um prompt de texto descritivo ou faça o upload de uma imagem de referência.
  3. Para edição, faça o upload de um vídeo base e use a caixa de prompt para especificar suas alterações (por exemplo, "mudar o fundo para uma floresta de inverno").
  4. Consulte nosso Guia de Prompts para obter dicas sobre como estruturar suas solicitações de vídeo.

Gemini Omni Character

O Gemini Omni Character foi projetado para resolver o desafio de manter a consistência do personagem em diferentes cenas e ângulos na IA generativa.

Vantagens:

  • Preservação de Identidade: Mantenha características faciais, roupas e proporções consistentes em várias gerações.
  • Poses Flexíveis: Gere o mesmo personagem em várias ações e ambientes.
  • Adaptabilidade de Estilo: Aplique diferentes estilos artísticos enquanto mantém a identidade central do personagem.

Como usar:

  1. Faça o upload de uma imagem de referência clara do seu assunto no módulo Character no seu Painel.
  2. Defina os traços principais do personagem no prompt do sistema.
  3. Gere novas cenas referenciando o perfil de personagem salvo em seus prompts de texto.

Gemini Omni Audio

Para complementar a geração visual, o Gemini Omni Audio fornece criação de som integrada, permitindo que você gere faixas de áudio que correspondam à sua saída de vídeo.

Vantagens:

  • Paisagens Sonoras Contextuais: Gere ruído ambiente e efeitos sonoros que correspondam diretamente ao contexto visual do seu vídeo.
  • Geração Sincronizada: Crie faixas de áudio projetadas para se alinhar ao ritmo de suas cenas geradas.
  • Entrada Multimodal: Use prompts de texto para definir o clima de áudio exato ou os efeitos sonoros necessários.

Como usar:

  1. Depois de gerar um clipe de vídeo, selecione a guia de geração de Áudio.
  2. Forneça um prompt de texto descrevendo o som desejado (por exemplo, "rua movimentada da cidade com sirenes distantes").
  3. Aplique a faixa de áudio gerada diretamente à linha do tempo do seu vídeo.

Primeiros Passos

A suíte Gemini Omni oferece uma abordagem unificada para a criação de conteúdo multimodal. Ao combinar os fluxos de trabalho de Vídeo, Personagem e Áudio, você pode construir narrativas completas a partir de uma única interface.

Para começar a experimentar esses modelos, vá para o seu Painel. Para tutoriais mais detalhados, visite nossa Central de Aprendizado ou Entre em Contato para obter suporte.