Veo 3: “Cơn sốt” đang khuấy đảo cộng đồng sáng tạo |
Flow là công cụ tạo video bằng AI được Google giới thiệu lần đầu vào tháng 5/2025, kết hợp sức mạnh của ba mô hình tiên tiến là Veo, Imagen và Gemini. Người dùng có thể tạo video từ văn bản mô tả, hình ảnh có sẵn hoặc khung hình mở đầu (Frames to Video). Với phiên bản mới nhất, Flow đã hỗ trợ tính năng tạo video từ ảnh bằng cách tải ảnh lên và mô tả nội dung cũng như âm thanh mong muốn. Hình ảnh này sau đó sẽ được “mở rộng” thành một đoạn video hoàn chỉnh, sống động.
Đáng chú ý, Veo 3, mô hình tạo video hàng đầu trong Flow, cũng được cập nhật thêm một loạt tính năng mới. Ngoài khả năng thêm hiệu ứng hình ảnh, âm thanh nền và tiếng động, người dùng giờ đây còn có thể thêm lời thoại vào đoạn video. Tính năng này hiện có sẵn trong chế độ Veo 3 Fast, cho phép người dùng trải nghiệm khả năng dựng video mượt mà hơn từ hình ảnh đầu vào.
Google lưu ý rằng tính năng tạo âm thanh vẫn đang trong giai đoạn thử nghiệm nên kết quả có thể thay đổi tùy trường hợp. Tuy nhiên, việc bổ sung liên tục các tùy chọn âm thanh, hình ảnh và lời thoại cho thấy Flow đang tiến gần hơn đến việc trở thành một trợ lý làm phim cá nhân dành cho mọi người, từ người sáng tạo nội dung đến các nhà làm phim nghiệp dư.
Song song với Flow, Google cũng đã tích hợp mô hình Veo 3 vào ứng dụng Gemini, cho phép người dùng sử dụng tính năng photo-to-video để biến các ảnh tĩnh thành video động dài 8 giây, kèm hiệu ứng âm thanh. Để trải nghiệm, người dùng chỉ cần vào mục “Videos” trong giao diện nhập lệnh của Gemini, tải ảnh lên, mô tả bối cảnh và âm thanh, hệ thống sẽ xử lý và tạo ra video tương ứng. Người dùng có thể tạo chuyển động cho vật dụng đời thường, tranh vẽ, hoặc cảnh thiên nhiên, giúp thổi hồn vào các bức ảnh vốn bất động.
Theo Google, chỉ trong vòng 7 tuần kể từ khi ra mắt, hơn 40 triệu video đã được tạo ra bằng Veo 3 thông qua Flow và Gemini. Các video này mang tính sáng tạo đa dạng, từ mô phỏng âm thanh ASMR đến tái hiện truyện cổ tích bằng phong cách hiện đại. Sự bùng nổ này cho thấy tiềm năng lớn của AI trong việc mở rộng giới hạn sáng tạo cá nhân.
Để đảm bảo tính minh bạch và an toàn nội dung, toàn bộ video do Veo 3 tạo ra đều đi kèm watermark (ảnh mờ) và dấu nhận diện ẩn SynthID, giúp phân biệt nội dung do AI tạo. Google cũng khuyến khích người dùng gửi phản hồi bằng cách nhấn “thích” hoặc “không thích” để cải thiện chất lượng công cụ.
Bên cạnh công cụ tạo video, Google cũng đang từng bước tích hợp AI Mode vào các tính năng tìm kiếm thông minh trên thiết bị di động. Cụ thể, chế độ Circle to Search nay cho phép người dùng khoanh vùng nội dung cần tìm trên màn hình, sau đó nhờ AI suy luận và cung cấp thông tin trực tiếp mà không cần chuyển sang ứng dụng khác. Trong một số trường hợp, hệ thống sẽ hiển thị phần “AI Overview” để người dùng đào sâu hơn nội dung bằng cách tiếp tục đặt câu hỏi. AI Mode cũng đã bắt đầu được thử nghiệm trong tính năng Google Lens, bước đầu áp dụng tại các thị trường như Mỹ và Ấn Độ.
Đối với người chơi game, Circle to Search được nâng cấp để nhận diện hình ảnh nhân vật, vật phẩm và cung cấp thông tin ngay lập tức, giúp trải nghiệm tìm kiếm trở nên linh hoạt và liền mạch hơn.
Với việc mở rộng Flow và các công cụ AI cao cấp đến 76 quốc gia, trong đó có Việt Nam, Google đang cho thấy quyết tâm phổ cập sức mạnh sáng tạo của AI tới cộng đồng toàn cầu. Sự ra mắt của các tính năng như Frames to Video, Photo-to-Video và tích hợp Veo 3 vào Gemini không chỉ mang đến công cụ mới cho người dùng, mà còn mở ra một kỷ nguyên sáng tạo đa phương tiện hoàn toàn mới, nơi bất kỳ ai cũng có thể trở thành nhà làm phim, nghệ sĩ hoặc người kể chuyện với sự hỗ trợ của Trí tuệ nhân tạo.
P.T
https%3A%2F%2Flaodongthudo.vn%2Fgoogle-mo-rong-cong-cu-tao-video-ai-flow-va-veo-3-tai-viet-nam-193894.html