Các mô hình. Thúc đẩy sự sáng tạo của bạn với các mô hình và công cụ truyền thông sáng tạo mới

Giới thiệu Veo 3 và Imagen 4, và một công cụ mới để làm phim có tên là Flow.

May 21, 2025
8 min read

Các mô hình. Thúc đẩy sự sáng tạo của bạn với các mô hình và công cụ truyền thông sáng tạo mới — Giới thiệu Veo 3 và Imagen 4, và một công cụ mới để làm phim có tên là Flow.

Khơi nguồn sáng tạo của bạn với các mô hình và công cụ truyền thông tạo sinh mới

Từ Imagen 4 và Veo 3 đến Flow, hãy dùng thử các công cụ tạo sinh phương tiện mới này ngay hôm nay.

Ảnh chụp màn hình bài viết

Hôm nay, chúng tôi xin giới thiệu các mô hình truyền thông tạo sinh mới nhất, đánh dấu những đột phá đáng kể. Các mô hình này tạo ra những hình ảnh, video và âm nhạc ngoạn mục, trao quyền cho các nghệ sĩ hiện thực hóa tầm nhìn sáng tạo của họ. Chúng cũng cung cấp các công cụ tuyệt vời để mọi người thể hiện bản thân.

Veo 3 và Imagen 4, các mô hình tạo video và hình ảnh mới nhất của chúng tôi, thúc đẩy giới hạn của quá trình tạo phương tiện, với các khả năng mới đột phá. Chúng tôi cũng đang mở rộng quyền truy cập vào Lyria 2, cung cấp cho các nhạc sĩ nhiều công cụ hơn để sáng tạo âm nhạc. Cuối cùng, chúng tôi mời những người kể chuyện bằng hình ảnh dùng thử Flow, công cụ làm phim AI mới của chúng tôi. Sử dụng các mô hình tiên tiến nhất của Google DeepMind, Flow cho phép bạn dệt nên những bộ phim điện ảnh với khả năng kiểm soát tinh vi hơn đối với nhân vật, cảnh và phong cách, để đưa câu chuyện của bạn vào cuộc sống.

Chúng tôi đã hợp tác chặt chẽ với các ngành công nghiệp sáng tạo — nhà làm phim, nhạc sĩ, nghệ sĩ, người sáng tạo YouTube — để giúp định hình các mô hình và sản phẩm này một cách có trách nhiệm và cung cấp cho người sáng tạo các công cụ mới để nhận ra những khả năng của AI trong nghệ thuật của họ.

Veo 3: Video, gặp âm thanh

Veo 3, mô hình tạo video hiện đại mới của chúng tôi, không chỉ cải thiện chất lượng của Veo 2 mà lần đầu tiên, còn có thể tạo ra video có âm thanh — tiếng ồn giao thông ở hậu cảnh của cảnh đường phố thành phố, tiếng chim hót trong công viên, thậm chí cả cuộc đối thoại giữa các nhân vật.

Trên mọi phương diện, Veo 3 đều vượt trội từ lời nhắc bằng văn bản và hình ảnh đến vật lý thực tế và đồng bộ hóa môi chính xác. Nó rất tuyệt vời trong việc thấu hiểu; bạn có thể kể một câu chuyện ngắn gọn trong lời nhắc của mình và mô hình sẽ trả lại cho bạn một đoạn clip thể hiện câu chuyện đó. Veo 3 hiện có sẵn cho người đăng ký Ultra ở Hoa Kỳ trong ứng dụng Gemini và trong Flow. Nó cũng có sẵn cho người dùng doanh nghiệp trên Vertex AI.

Cập nhật Veo 2: Các khả năng mới được xây dựng với và cho các nhà làm phim

Khi chúng tôi nâng cấp Veo 3, chúng tôi cũng đã thêm các khả năng mới vào mô hình Veo 2 phổ biến của mình, được xây dựng dựa trên công việc của chúng tôi với những người sáng tạo và nhà làm phim. Hôm nay, chúng tôi đang tung ra một số khả năng mới này, bao gồm:

Tính năng video được hỗ trợ tham khảo hiện đại của chúng tôi cho phép bạn cung cấp cho Veo hình ảnh về nhân vật, cảnh, đối tượng và thậm chí cả phong cách để kiểm soát và nhất quán sáng tạo tốt hơn.
Điều khiển máy ảnh giúp bạn xác định chính xác chuyển động của máy ảnh, bao gồm xoay, đẩy và thu phóng, để đạt được cảnh quay hoàn hảo.
Vẽ ngoài cho phép bạn mở rộng khung hình, chuyển video của bạn từ chân dung sang phong cảnh và giúp bạn dễ dàng điều chỉnh mọi kích thước màn hình, đồng thời bổ sung một cách thông minh vào cảnh.
Thêm và xóa đối tượng cho phép bạn thêm hoặc xóa các đối tượng khỏi video của mình. Veo hiểu tỷ lệ, tương tác và bóng đổ, đồng thời sử dụng sự hiểu biết này để tạo ra một cảnh trông tự nhiên và chân thực.

Một người phụ nữ đi bộ trong hành lang được thực hiện với Veo2

Một cảnh đan được thực hiện bởi Veo

Vẽ ngoài

Cảnh phi hành gia với Veo

Xóa hình ảnh

Video được hỗ trợ tham khảo và điều khiển máy ảnh hiện đã có trong Flow. Chúng tôi rất vui khi mang tất cả các khả năng mới này đến Vertex AI API trong những tuần tới và đến nhiều sản phẩm hơn trong vài tháng tới.

Flow: Công cụ làm phim AI được thiết kế cho Veo

Flow, được xây dựng với và cho những người sáng tạo, là một công cụ làm phim AI cho phép bạn tạo liền mạch các clip, cảnh và câu chuyện điện ảnh bằng cách kết hợp các mô hình tiên tiến nhất của Google DeepMind: Veo, Imagen và Gemini. Sử dụng ngôn ngữ tự nhiên để mô tả các cảnh quay của bạn cho Flow, quản lý các thành phần cho câu chuyện của bạn — dàn diễn viên, địa điểm, đối tượng và phong cách — ở một nơi thuận tiện duy nhất và sử dụng Flow để dệt câu chuyện của bạn thành những cảnh đẹp.

Flow hiện có sẵn cho người đăng ký gói Google AI Pro và Ultra ở Hoa Kỳ, với nhiều quốc gia khác sẽ sớm ra mắt.

Imagen 4: Chất lượng tuyệt đẹp và kiểu chữ vượt trội

Mô hình Imagen mới nhất của chúng tôi kết hợp tốc độ với độ chính xác để tạo ra những hình ảnh tuyệt đẹp. Imagen 4 có độ rõ nét đáng kể ở các chi tiết đẹp như vải phức tạp, giọt nước và lông động vật, đồng thời vượt trội cả về phong cách hiện thực và trừu tượng. Imagen 4 có thể tạo hình ảnh với nhiều tỷ lệ khung hình và độ phân giải lên đến 2k - thậm chí còn tốt hơn cho việc in ấn hoặc thuyết trình. Nó cũng vượt trội hơn đáng kể về chính tả và kiểu chữ, giúp bạn dễ dàng tạo thiệp chúc mừng, áp phích và thậm chí cả truyện tranh của riêng mình.

Imagen 4 hiện có sẵn trong ứng dụng Gemini, Whisk, Vertex AI và trên Slides, Vids, Docs, v.v. trong Workspace.

Sắp tới, chúng tôi cũng sẽ tung ra một biến thể nhanh của Imagen 4, nhanh hơn gấp 10 lần so với Imagen 3 — để bạn có thể khám phá ý tưởng thậm chí còn nhanh hơn.

Lyria 2: Sáng tác mạnh mẽ và khám phá vô tận

Vào tháng 4, chúng tôi đã mở rộng quyền truy cập vào Music AI Sandbox, được hỗ trợ bởi Lyria 2. Music AI Sandbox cung cấp cho các nhạc sĩ, nhà sản xuất và nhạc sĩ một bộ công cụ thử nghiệm, có thể khơi dậy những khả năng sáng tạo mới và giúp các nghệ sĩ khám phá những ý tưởng âm nhạc độc đáo. Chuyên môn và phản hồi có giá trị từ ngành công nghiệp âm nhạc giúp chúng tôi đảm bảo các công cụ của mình trao quyền cho người sáng tạo, đồng thời mời những người sáng tạo hiện thực hóa những khả năng của AI trong nghệ thuật của họ.

Lyria 2 mang lại khả năng sáng tác mạnh mẽ và khám phá vô tận, đồng thời hiện đã có sẵn cho người sáng tạo thông qua YouTube Shorts và các doanh nghiệp trong Vertex AI. Chúng tôi cũng đã tạo Lyria RealTime, mô hình tạo nhạc tương tác của chúng tôi cung cấp năng lượng cho MusicFX DJ, có sẵn thông qua API và trong AI Studio. Lyria RealTime cho phép bất kỳ ai tương tác tạo, kiểm soát và biểu diễn nhạc tạo sinh trong thời gian thực.

Sáng tạo có trách nhiệm và cộng tác với cộng đồng sáng tạo

Kể từ khi ra mắt vào năm 2023, SynthID đã đóng dấu bản quyền cho hơn 10 tỷ hình ảnh, video, tệp âm thanh và văn bản, giúp xác định chúng là do AI tạo ra và giảm khả năng thông tin sai lệch và gán sai. Đầu ra được tạo bởi Veo 3, Imagen 4 và Lyria 2 sẽ tiếp tục có hình mờ SynthID.

Hôm nay, chúng tôi ra mắt SynthID Detector, một cổng thông tin xác minh để giúp mọi người xác định nội dung do AI tạo ra. Tải lên một phần nội dung và SynthID Detector sẽ xác định xem toàn bộ tệp hay chỉ một phần của tệp có SynthID hay không.

Với tất cả các mô hình AI tạo sinh của mình, chúng tôi mong muốn giải phóng sự sáng tạo của con người và cho phép các nghệ sĩ và người sáng tạo đưa ý tưởng của họ vào cuộc sống nhanh hơn và dễ dàng hơn bao giờ hết.

AI Today - SkyAI