Trước đây, khi yêu cầu chỉnh sửa ảnh, Gemini sẽ tạo ra hình ảnh hoàn toàn mới, thay đổi cảnh vật, vật thể và màu sắc.
Hiện tại, người dùng có thể giữ hình ảnh ban đầu và chỉ thay đổi một phần như màu cỏ, phong nền hoặc thêm chữ bằng ngôn ngữ tự động.
Ví dụ điển hình: hình ảnh con chó vẫn giữ nguyên, chỉ có cỏ đổi sang màu xanh lam – cho thấy công nghệ mới có khả năng chỉnh sửa chính xác và giữ bối cảnh hình ảnh.
Hình ảnh tạo ra giờ đây hiển thị thủy vân vân “AI” ở góc dưới bên phải – Google đang thử nghiệm cách hiển thị điều này giống với thủy vân kỹ thuật số SynthID vô hình .
Tính năng cũng hỗ trợ tải lên hình ảnh từ người dùng: bạn có thể thay đổi màu tóc hoặc thử tạo phiên bản khác của cá nhân hình ảnh.
Khả năng chỉnh sửa nhiều bước giúp duy trì mạch hội thoại và cho phép kết hợp văn bản – hình ảnh như tạo câu chuyện có hình ảnh minh họa từng bước.
Công nghệ này được vận hành bởi Gemini 2.0 Flash , nhưng có thể sử dụng trên bất kỳ mô hình Gemini nào.
Hiện đã có mặt rộng rãi hơn tại Mỹ trên tài khoản miễn phí và gói Gemini Advanced.
Đối với người lập trình, Google thông báo Gemini 2.0 Flash Image Generation & Editing hiện có bản xem trước trên Gemini API qua Google AI Studio và Vertex AI .
So với thử nghiệm tháng 3, Google đã cải thiện đáng kể: chất lượng hình ảnh tốt hơn, hiển thị văn bản chính xác hơn , và giảm tỷ lệ bị chặn nội dung .
Nguồn bài viết: https://songai.vn/posts/google-cho-phep-chinh-sua-anh-bang-loi-noi-ngay-trong-app-gemini
https%3A%2F%2Fvnreview.vn%2Fthreads%2Fchi-can-noi-anh-se-tu-sua-cong-nghe-ai-moi-cua-google-sap-khien-photoshop-loi-thoi.60941%2F