Brand pagetool

Hướng dẫn sử dụng Gemini Omni: Video, Nhân vật và Âm thanh

Khám phá Gemini Omni: Sáng tạo đa phương thức trong Veo4 Studio

Gemini Omni là mô hình sáng tạo đa phương thức của Google được xây dựng để tạo và chỉnh sửa nội dung từ nhiều loại đầu vào khác nhau. Bắt đầu với video, dòng Omni được thiết kế để hợp lý hóa các quy trình sáng tạo phức tạp. Mô hình đầu tiên trong dòng sản phẩm này, Gemini Omni Flash, hỗ trợ tạo và chỉnh sửa video thiết thực, cho phép chỉnh sửa bằng ngôn ngữ tự nhiên, tạo dựa trên tham chiếu, chuyển đổi cảnh và kể chuyện bằng hình ảnh mạch lạc.

Trong Veo4 Studio, bạn có thể tận dụng các khả năng của bộ công cụ Gemini Omni để xây dựng các dự án truyền thông toàn diện. Dưới đây là tổng quan về các tính năng cốt lõi—Video, Nhân vật (Character) và Âm thanh (Audio)—và cách sử dụng chúng.

Gemini Omni Video

Gemini Omni Video tập trung vào việc tạo và sửa đổi nội dung video chất lượng cao bằng cách sử dụng đầu vào văn bản và hình ảnh.

Ưu điểm:

  • Chỉnh sửa bằng ngôn ngữ tự nhiên: Sửa đổi các video clip hiện có chỉ bằng cách nhập những gì bạn muốn thay đổi.
  • Tạo dựa trên tham chiếu: Sử dụng hình ảnh hoặc video khác làm tham chiếu về phong cách hoặc cấu trúc.
  • Chuyển đổi cảnh: Thay đổi môi trường hoặc thời gian trong ngày trong một cảnh mà không làm mất chủ thể chính.
  • Kể chuyện bằng hình ảnh mạch lạc: Duy trì tính nhất quán về mặt hình ảnh trên nhiều cảnh quay được tạo.

Cách sử dụng:

  1. Điều hướng đến Bảng điều khiển của bạn và chọn công cụ tạo Video.
  2. Nhập lời nhắc văn bản mô tả hoặc tải lên hình ảnh tham chiếu.
  3. Để chỉnh sửa, hãy tải lên video cơ sở và sử dụng hộp lời nhắc để chỉ định các thay đổi của bạn (ví dụ: "thay đổi nền thành khu rừng mùa đông").
  4. Tham khảo Hướng dẫn Lời nhắc của chúng tôi để biết các mẹo về cách cấu trúc các yêu cầu video của bạn.

Gemini Omni Character

Gemini Omni Character được thiết kế để giải quyết thách thức trong việc duy trì tính nhất quán của nhân vật qua các cảnh và góc độ khác nhau trong AI tạo sinh.

Ưu điểm:

  • Bảo toàn danh tính: Giữ cho các đặc điểm trên khuôn mặt, quần áo và tỷ lệ nhất quán qua nhiều lần tạo.
  • Tạo dáng linh hoạt: Tạo cùng một nhân vật trong nhiều hành động và môi trường khác nhau.
  • Khả năng thích ứng phong cách: Áp dụng các phong cách nghệ thuật khác nhau trong khi vẫn giữ nguyên danh tính cốt lõi của nhân vật.

Cách sử dụng:

  1. Tải lên hình ảnh tham chiếu rõ ràng về chủ thể của bạn vào mô-đun Character trong Bảng điều khiển của bạn.
  2. Xác định các đặc điểm cốt lõi của nhân vật trong lời nhắc hệ thống.
  3. Tạo các cảnh mới bằng cách tham chiếu hồ sơ nhân vật đã lưu trong lời nhắc văn bản của bạn.

Gemini Omni Audio

Để bổ sung cho việc tạo hình ảnh, Gemini Omni Audio cung cấp tính năng tạo âm thanh tích hợp, cho phép bạn tạo các bản nhạc phù hợp với đầu ra video của mình.

Ưu điểm:

  • Cảnh quan âm thanh theo ngữ cảnh: Tạo tiếng ồn xung quanh và hiệu ứng âm thanh phù hợp trực tiếp với ngữ cảnh hình ảnh của video.
  • Tạo đồng bộ: Tạo các bản nhạc được thiết kế để phù hợp với nhịp độ của các cảnh được tạo.
  • Đầu vào đa phương thức: Sử dụng lời nhắc văn bản để xác định chính xác tâm trạng âm thanh hoặc hiệu ứng âm thanh cần thiết.

Cách sử dụng:

  1. Sau khi tạo video clip, hãy chọn tab tạo Âm thanh.
  2. Cung cấp lời nhắc văn bản mô tả âm thanh mong muốn (ví dụ: "đường phố nhộn nhịp với tiếng còi báo động từ xa").
  3. Áp dụng bản nhạc đã tạo trực tiếp vào dòng thời gian video của bạn.

Bắt đầu

Bộ công cụ Gemini Omni cung cấp một cách tiếp cận thống nhất để tạo nội dung đa phương thức. Bằng cách kết hợp quy trình làm việc Video, Nhân vật và Âm thanh, bạn có thể xây dựng các câu chuyện hoàn chỉnh từ một giao diện duy nhất.

Để bắt đầu thử nghiệm với các mô hình này, hãy truy cập Bảng điều khiển của bạn. Để có các hướng dẫn chi tiết hơn, hãy truy cập Trung tâm học tập hoặc Liên hệ với chúng tôi để được hỗ trợ.