
Ông Wang cho biết các nhóm nghiên cứu của Meta sẽ phối hợp cùng Midjourney nhằm tích hợp công nghệ của họ vào các mô hình và sản phẩm AI trong tương lai.
Giám đốc AI của Meta nhấn mạnh rằng để mang đến những sản phẩm tốt nhất, Meta sẽ cần một chiến lược “toàn diện từ nhiều hướng tiếp cận”. Việc này gồm việc thu hút nhân tài đẳng cấp thế giới, xây dựng lộ trình hạ tầng tính toán tham vọng và hợp tác với những đối tác hàng đầu trong ngành.
Thỏa thuận này được kỳ vọng sẽ giúp Meta phát triển các sản phẩm có khả năng cạnh tranh với những mô hình AI tạo ảnh và video hàng đầu hiện nay như Sora của OpenAI, Flux của Black Forest Lab hay Veo của Google.
Năm ngoái, Meta đã tung ra công cụ tạo ảnh bằng AI có tên Imagine, tích hợp vào nhiều nền tảng như Facebook, Instagram và Messenger. Hãng cũng sở hữu Movie Gen, một công cụ tạo video từ mô tả văn bản.
Việc tích hợp công nghệ từ Midjourney đánh dấu bước đi mới nhất của Meta trong cuộc đua AI. Trước đó, CEO Mark Zuckerberg đã chiêu mộ hàng loạt nhân sự AI, sẵn sàng chi các gói đãi ngộ lên tới hơn 100 triệu USD cho một số nhà nghiên cứu. Meta cũng rót 14 tỉ USD vào Scale AI và mua lại startup giọng nói AI Play AI.
Ngoài Midjourney, Meta từng tiếp xúc với nhiều phòng thí nghiệm AI hàng đầu để bàn về các thương vụ tiềm năng. Thậm chí, Zuckerberg còn thảo luận với Elon Musk về khả năng tham gia vào thương vụ 97 tỉ USD nhằm thâu tóm OpenAI. Tuy nhiên, Meta cuối cùng không tham gia và phía OpenAI cũng bác bỏ đề xuất của Musk.
Điều khoản cụ thể trong thỏa thuận với Midjourney chưa được tiết lộ. Dù vậy, CEO David Holz khẳng định trên X rằng công ty của ông vẫn độc lập, không có nhà đầu tư bên ngoài. Đây cũng là điểm đặc biệt: Midjourney là một trong số ít nhà phát triển AI hàng đầu chưa từng gọi vốn từ bên ngoài. Theo Upstarts Media, Meta từng có thời điểm cân nhắc thâu tóm startup này.
Ra đời năm 2022, Midjourney nhanh chóng vươn lên thành cái tên dẫn đầu trong lĩnh vực tạo ảnh bằng AI nhờ phong cách độc đáo và chân thực. Đến năm 2023, công ty được cho là đạt doanh thu khoảng 200 triệu USD, với mô hình kinh doanh dựa trên đăng ký dịch vụ: gói cơ bản từ 10 USD/tháng, còn các gói cao cấp cho phép tạo nhiều ảnh hơn có giá lên tới 120 USD/tháng. Tháng 6 vừa qua, Midjourney ra mắt mô hình tạo video đầu tiên mang tên V1.
Hợp tác giữa Meta và Midjourney diễn ra chỉ hai tháng sau khi startup này bị Disney và Universal kiện, cáo buộc đã huấn luyện mô hình AI tạo ảnh dựa trên các tác phẩm có bản quyền. Nhiều công ty AI khác, trong đó có Meta, cũng đối mặt với những vụ kiện tương tự. Tuy nhiên, một số phán quyết gần đây liên quan đến dữ liệu huấn luyện AI đã nghiêng về phía các công ty công nghệ.
So sánh công nghệ tạo ảnh giữa Meta và ChatGPT
Công nghệ tạo ảnh của Meta
Meta đã phát triển công cụ tạo ảnh AI của riêng mình, được gọi là Imagine with Meta AI. Công cụ này được tích hợp vào các nền tảng của họ như Facebook, Instagram và Messenger.
Nguồn gốc công nghệ: Imagine được xây dựng trên mô hình AI tạo sinh riêng của Meta.
Điểm mạnh:
Tích hợp sâu: Lợi thế lớn nhất của Imagine là nó được tích hợp trực tiếp vào các ứng dụng mạng xã hội của Meta. Người dùng có thể dễ dàng tạo và chia sẻ hình ảnh mà không cần rời khỏi nền tảng.
Tốc độ: Do được tối ưu hóa cho các nền tảng của Meta, công cụ này có tốc độ tạo ảnh khá nhanh.
Dễ tiếp cận: Hướng tới người dùng phổ thông, giao diện của Imagine rất đơn giản và dễ sử dụng.
Điểm yếu:
Chất lượng và sự độc đáo: So với các công cụ chuyên biệt khác như Midjourney, Imagine thường cho ra kết quả chưa thật sự độc đáo hay có phong cách nghệ thuật ấn tượng. Các hình ảnh có thể trông “công nghiệp” hơn.
Hạn chế về tính năng: Imagine tập trung vào việc tạo ảnh từ văn bản, nhưng các tính năng nâng cao như tùy chỉnh chi tiết, thay đổi phong cách hoặc chỉnh sửa ảnh hiện có còn hạn chế.
Công nghệ tạo ảnh của ChatGPT
ChatGPT, do OpenAI phát triển, sử dụng mô hình DALL-E 3 để tạo hình ảnh. DALL-E 3 là một trong những mô hình tạo ảnh mạnh mẽ nhất hiện nay.
Nguồn gốc công nghệ: DALL-E 3 là một mô hình tạo sinh hình ảnh độc lập, được tích hợp vào các phiên bản trả phí của ChatGPT (ChatGPT Plus, Team, Enterprise).
Điểm mạnh:
Khả năng hiểu văn bản: DALL-E 3 nổi tiếng với khả năng hiểu ngữ cảnh và các chi tiết phức tạp trong câu lệnh của người dùng một cách vượt trội. Nó có thể tạo ra các hình ảnh chính xác hơn và đúng với ý tưởng ban đầu.
Chất lượng hình ảnh: Hình ảnh được tạo ra bởi DALL-E 3 thường có chất lượng cao, độ chi tiết tốt và phong cách đa dạng hơn, từ chân thực đến hoạt hình hay tranh vẽ.
Tính năng bổ trợ: Người dùng có thể yêu cầu ChatGPT tinh chỉnh lại ảnh một cách chi tiết hơn bằng cách trò chuyện, điều này giúp tối ưu hóa kết quả.
Điểm yếu:
Tốc độ xử lý: Việc tạo ảnh có thể mất nhiều thời gian hơn so với các công cụ đơn giản hơn.
https%3A%2F%2F1thegioi.vn%2Fmeta-tich-hop-cong-nghe-tao-anh-va-video-bang-ai-cua-midjourney-236594.html