TÓM TẮT:
Cuộc cách mạng công nghiệp lần thứ tư với những đột phá mạnh mẽ về công nghệ, đặc biệt là Trí tuệ nhân tạo (TTNT) tạo sinh, đang tạo ra những biến chuyển lớn trong xã hội và đặt ra hàng loạt vấn đề pháp lý mới. Trước thực tiễn đó, yêu cầu cải cách pháp luật, đặc biệt là pháp luật về sở hữu trí tuệ (SHTT) trở nên cấp thiết nhằm đảm bảo tính phù hợp và hiệu quả trong bối cảnh mới. Bài viết phân tích cách tiếp cận của một số hệ thống pháp luật trên thế giới trong việc quy định ngoại lệ quyền tác giả đối với huấn luyện TTNT, từ đó đưa ra một số định hướng hoàn thiện pháp luật Việt Nam về SHTT. Những nội dung này góp phần cung cấp thêm cơ sở tham khảo cho nghiên cứu và xây dựng pháp luật trong những lĩnh vực mới và phức tạp xuất phát từ sự phát triển của công nghệ số.
Từ khóa: trí tuệ nhân tạo, ngoại lệ quyền tác giả, khai thác văn bản và dữ liệu.
1. Đặt vấn đề
Sự bùng nổ của TTNT, đặc biệt là TTNT tạo sinh, đang định hình lại cách thức con người sáng tạo, giao tiếp và xử lý thông tin. Bên cạnh những lợi ích rõ rệt, đột phá công nghệ này đặt ra nhiều thách thức pháp lý, đặc biệt là nguy cơ xâm phạm quyền tác giả (QTG) trong quá trình đào tạo mô hình AI. TTNT tạo sinh cần được huấn luyện trên các tệp dữ liệu khổng lồ, trong đó không ít là các tác phẩm có bản quyền. Chính điều này gây ra những xung đột lợi ích đáng kể giữa nền công nghiệp sáng tạo và các nhà phát triển AI (Artificial Intelligence), thể hiện ở việc nhiều công ty TTNT hàng đầu đang vướng vào những vụ kiện liên quan đến hành vi sử dụng tác phẩm có bản quyền để huấn luyện mô hình. Trước thực tế đó, nhiều quốc gia đã xây dựng các cơ chế ngoại lệ cho phép khai thác tác phẩm có bản quyền phục vụ đào tạo AI ở các mức độ khác nhau. Trong bối cảnh Việt Nam xác định TTNT là lĩnh vực công nghệ trọng yếu, nhu cầu về xây dựng một ngoại lệ QTG phù hợp cho hoạt động đào tạo TTNT tạo sinh là tương đối cấp thiết. Tuy nhiên, các nghiên cứu trong nước hiện mới chủ yếu tập trung vào vấn đề bảo hộ tác phẩm do AI tạo ra mà chưa chú trọng đến khía cạnh đào tạo mô hình. Nhằm lấp đầy khoảng trống nghiên cứu đó, bài viết tập trung làm rõ quy trình huấn luyện TTNT, phân tích rủi ro xâm phạm QTG, khảo sát kinh nghiệm quốc tế về các ngoại lệ QTG phục vụ đào tạo AI, từ đó đề xuất một số định hướng sửa đổi pháp luật Việt Nam về SHTT, bảo đảm hài hòa giữa phát triển công nghệ và bảo vệ quyền lợi tác giả.
2. Quy trình huấn luyện trí tuệ nhân tạo tạo sinh và nguy cơ xâm phạm quyền tác giả
TTNT tạo sinh (gen AI) là một nhánh quan trọng của công nghệ AI, có khả năng tạo ra nội dung mới như văn bản, hình ảnh, mã nguồn,… dựa trên mô hình học sâu (deep learning). Các mô hình này hoạt động bằng cách xác định và mã hóa các mẫu và mối quan hệ trong lượng dữ liệu khổng lồ được cung cấp, sau đó sử dụng thông tin để hiểu các yêu cầu hoặc câu hỏi bằng ngôn ngữ tự nhiên của người dùng và phản hồi bằng nội dung mới có liên quan[1]. Theo khảo sát của McKinsey, đến thời điểm hiện tại 71% tổ chức đã sử dụng gen AI trong ít nhất một chức năng kinh doanh, tăng từ mức 65% vào đầu năm 2024[2].
Nhằm đạt được hiệu quả và độ chính xác cao, quy trình huấn luyện TTNT tạo sinh thường trải qua 3 giai đoạn huấn luyện gắn liền với những nguy cơ xâm phạm quyền tác giả, mà chủ yếu là quyền sao chép.
– Thu thập dữ liệu (data collection): Đây là bước đầu tiên, yêu cầu thu thập lượng dữ liệu lớn từ Internet, thường thông qua công cụ tải xuống dữ liệu tự động như web scraping. Ở bước này, các công ty TTNT có khả năng xâm phạm quyền sao chép thông qua việc tải về và lưu trữ dữ liệu, hoạt động vốn được hiểu là tạo ra các bản sao từ tác phẩm gốc[3].
– Tiền huấn luyện mô hình (pre-training phase): Tiền huấn luyện là giai đoạn các công ty TTNT huấn luyện thuật toán học sâu (deep learning) trên một khối lượng dữ liệu lớn, chưa có cấu trúc và chưa được gắn nhãn. Thuật toán thực hiện và đánh giá hàng triệu bài tập theo kiểu “điền vào chỗ trống”, cố gắng dự đoán yếu tố tiếp theo trong một chuỗi – ví dụ: từ tiếp theo trong một câu, thành phần tiếp theo trong một hình ảnh, hoặc lệnh tiếp theo trong một dòng mã lập trình và liên tục điều chỉnh bản thân để giảm thiểu sự khác biệt giữa dự đoán của nó và dữ liệu thực tế (hoặc “kết quả đúng”)[4]. Kết quả của giai đoạn này thường là sự ra đời của một mô hình nền tảng (base model), có khả năng tạo sinh nội dung. Giai đoạn tiền huấn luyện có thể xâm phạm quyền sao chép. Ví dụ một mẫu huấn luyện cần được tải vào bộ nhớ làm việc (hành vi sao chép) để huấn luyện một mô hình TTNT dựa trên nó.
– Tinh chỉnh (tunning phase): Nói một cách dễ hiểu, giai đoạn tinh chỉnh về cơ bản chỉ là việc huấn luyện thêm cho mô hình nền tảng (dựa trên tệp dữ liệu mang tính chuyên ngành) vốn là kết quả của giai đoạn huấn luyện trước. Ví dụ: một công ty muốn tạo ra một chatbot chẩn đoán y khoa sơ bộ thì ở giai đoạn này mô hình TTNT cần được đào tạo dựa trên các tệp tài liệu chứa lượng lớn các tài liệu thông tin về y khoa. Tương tự giai đoạn trước, việc sử dụng tài liệu có bản quyền để tinh chỉnh có nguy cơ xâm phạm quyền sao chép.
Sau khi hoàn tất huấn luyện, các mô hình AI vẫn tiếp tục được cập nhật thông qua phương pháp như RAG – tạo sinh tăng cường truy xuất (retrieval augmented generation), cho phép mô hình truy xuất và sử dụng tài liệu từ cơ sở dữ liệu nội bộ hoặc Internet để tạo ra nội dung cập nhật nhất. Việc sao chép nội dung trong quá trình này cũng có thể xâm phạm quyền sao chép. Bên cạnh đó, một số quan điểm cho rằng, các mô hình TTNT tạo sinh về bản chất là một tổ hợp trừu tượng từ các dữ liệu huấn luyện của nó, do đó hoàn toàn phù hợp với định nghĩa về tác phẩm phái sinh theo luật bản quyền[5]. Tuy nhiên, quan điểm nêu trên vẫn chưa được thống nhất một cách rộng rãi.
Tóm lại, hầu hết các giai đoạn trong quá trình huấn luyện TTNT tạo sinh đều tiềm ẩn nguy cơ xâm phạm QTG ở mức độ nhất định. Trước bối cảnh đó, nhu cầu cân bằng giữa bảo hộ quyền tác giả và thúc đẩy tiến bộ công nghệ trở nên cấp thiết và cơ chế ngoại lệ quyền tác giả được xem là công cụ pháp lý phù hợp để thực hiện mục tiêu này.
3. Cơ sở quy định ngoại lệ quyền tác giả đối với huấn luyện trí tuệ nhân tạo tạo sinh
Sáng tạo là quá trình kế thừa liên tục và hiếm có tác phẩm nào là mới hoàn toàn. Như thẩm phán Story từng nhận định: “Trong văn học, khoa học và nghệ thuật, có thể có, nhưng rất ít, những thứ, theo nghĩa trừu tượng là hoàn toàn mới và nguyên bản. Mọi cuốn sách trong văn học, khoa học và nghệ thuật đều vay mượn và nhất thiết phải vay mượn, sử dụng nhiều thứ đã được biết đến và sử dụng trước đó”[6]. Bởi vậy, nếu bảo hộ QTG một cách tuyệt đối, mục tiêu thúc đẩy sáng tạo sẽ bị hạn chế do thiếu nền tảng từ các tác phẩm gốc để phát triển tác phẩm mới. Những ngoại lệ QTG ra đời với mục tiêu này, thúc đẩy quá trình sáng tạo liên tục nhưng vẫn đảm bảo quyền lợi cho chủ thể QTG.
Trên cơ sở đó, nhiều hệ thống pháp luật hiện nay cho phép sao chép tác phẩm có bản quyền với mục đích nghiên cứu, học tập cá nhân. Ngoại lệ này tạo điều kiện để con người tiếp xúc, phân tích tác phẩm gốc, kết hợp với sự sáng tạo cá nhân tạo ra những tác phẩm mới có thể được bảo hộ và đóng góp vào kho tàng tri thức nhân loại. Theo quan điểm của người viết, TTNT cũng vận hành theo logic tương tự não người. Về lý thuyết, các mô hình AI học từ dữ liệu tương tự như cách con người tiếp thu kiến thức từ tác phẩm. Thực tế nhiều đầu ra của AI có giá trị nghệ thuật độc lập, chứ không đơn thuần là tái tạo lại tác phẩm gốc từ bộ dữ liệu[7]. Hơn nữa, việc sao chép tác phẩm trong đào tạo AI chủ yếu nhằm trích xuất mẫu, không dùng để thương mại hóa hay truyền đạt nội dung gốc đến công chúng, nên ít có tác động đến thị trường của tác phẩm. Văn phòng Bản quyền Hoa Kỳ cũng đã nhận định: “TTNT tạo sinh thường không công khai những gì đã được sao chép, hầu hết đầu ra từ các hệ thống AI tạo sinh không chứa biểu đạt được bảo hộ từ dữ liệu huấn luyện”[8]. Do đó, nếu được thiết kế cẩn trọng, ngoại lệ QTG cho huấn luyện TTNT vẫn phù hợp với mục tiêu của luật bản quyền, cân bằng lợi ích giữa tác giả và cộng đồng, thúc đẩy phát triển công nghệ mà không xâm hại quyền lợi kinh tế chính đáng của tác giả.
4. Khung pháp lý một số quốc gia về ngoại lệ quyền tác giả đối với huấn luyện trí tuệ nhân tạo tạo sinh
Các quy định pháp luật về ngoại lệ quyền tác giả cho mục đích huấn luyện TTNT hiện nay còn tồn tại những khác biệt đáng kể giữa các quốc gia, phản ánh sự đa dạng trong cách tiếp cận của mỗi hệ thống pháp lý đối với việc cân bằng giữa phát triển công nghệ mới và bảo hộ quyền lợi của các chủ sở hữu QTG. Trong khuôn khổ mục này, tác giả sẽ phân tích cách tiếp cận của 3 hệ thống pháp luật khác nhau đối với ngoại lệ QTG trong hoạt động huấn luyện TTNT, đại diện cho 3 mức độ kiểm soát khác nhau, gồm: kiểm soát chặt chẽ (đại diện bởi Trung Quốc), kiểm soát có điều kiện (đại diện bởi Liên minh Châu Âu) và không kiểm soát cụ thể (đại diện bởi Hoa Kỳ).
4.1. Trung Quốc
Trung Quốc là quốc gia có ngành công nghiệp TTNT phát triển hàng đầu, mặc dù vậy, nước này hiện không công nhận bất kỳ ngoại lệ quyền tác giả nào dành cho đào tạo TTNT tạo sinh. Điều 24 Luật Bản quyền Trung Quốc liệt kê 13 trường hợp ngoại lệ, nhưng không đề cập đến hoạt động đào tạo AI hay hoạt động khác liên quan như khai thác văn bản và dữ liệu tự động (TDM)[9]. Bên cạnh đó, Điều 7.2 của Quy định tạm thời về quản lý các dịch vụ TTNT tạo sinh yêu cầu các nhà cung cấp AI “phải đảm bảo không xâm phạm quyền sở hữu trí tuệ hợp pháp của người khác” trong toàn bộ quá trình huấn luyện, bao gồm cả tiền huấn luyện và tinh chỉnh[10]. Vào tháng 2/2025, Ủy ban Kỹ thuật Quốc gia về An ninh mạng Trung Quốc ban hành bộ tài liệu kỹ thuật “Các yêu cầu an toàn cơ bản của dịch vụ TTNT tạo sinh”[11], tiếp tục siết chặt nghĩa vụ tuân thủ quyền SHTT, đáng chú ý là một số yêu cầu như: sử dụng dữ liệu mã nguồn phải có các tài liệu cấp phép liên quan; không được thu thập dữ liệu mà người khác đã công khai tuyên bố không được thu thập (Điều 5.1.c); các nhà cung cấp dịch vụ AI tạo sinh phải có cán bộ chuyên trách về quyền sở hữu trí tuệ (Điều 5.2.b.1) hay có cơ chế để chủ thể quyền gửi khiếu nại liên quan đến sở hữu trí tuệ (Điều 5.2.b.3),… Từ những quy định nêu trên, có thể thấy, Trung Quốc đang xây dựng một khung pháp lý khá nghiêm ngặt về bảo vệ QTG trong đào tạo mô hình AI, các công ty tại Trung Quốc bằng cách này hay cách khác cần phải tuân thủ quy định về SHTT. Một số tài liệu cho rằng, các doanh nghiệp tại quốc gia này thường sử dụng các tệp dữ liệu của bên thứ ba với điều kiện các nhà cung cấp này cũng phải đảm bảo tuân thủ đầy đủ quy định về QTG.
4.2. Liên minh châu Âu
Khác với Trung Quốc, Liên minh châu Âu (EU) áp dụng chính sách pháp luật cởi mở hơn trong việc huấn luyện TTNT. Chỉ thị (EU) 2019/790[12] về QTG và các quyền liên quan trong thị trường số thống nhất đã thiết lập ngoại lệ cho việc khai thác văn bản và dữ liệu tự động (text and data mining – TDM) phục vụ nghiên cứu khoa học (Điều 3) và các mục đích khác, bao gồm mục đích thương mại (Điều 4). TDM được ịnh nghĩa tại Điều 2.2 là “bất kỳ kỹ thuật phân tích tự động nào nhằm phân tích văn bản và dữ liệu dưới dạng kỹ thuật số để tạo ra thông tin, bao gồm nhưng không giới hạn ở các mẫu (patterns), xu hướng (trends) và mối tương quan (correlations)”. Các công ty công nghệ đang viện dẫn Điều 4 của Chỉ thị để lập luận rằng việc đào tạo mô hình TTNT trên cơ sở các tác phẩm có bản quyền là hợp pháp, miễn rằng đáp ứng các điều kiện: tài liệu được truy cập hợp pháp, lưu trữ dữ liệu chỉ trong khoảng thời gian cần thiết và tôn trọng bảo lưu quyền của chủ sở hữu quyền. Tuy nhiên, lập luận này vấp phải phản đối từ các chủ sở hữu quyền, bởi họ cho rằng ngoại lệ TDM không được thiết kế dành cho TTNT. Làm rõ vấn đề này, Liên minh châu Âu đã tuyên bố lập trường cụ thể trong lời dẫn số 105 của Đạo luật TTNT (EU) 2024/1689, theo đó “Việc phát triển và đào tạo các mô hình AI đa năng (được định nghĩa bao gồm cả TTNT tạo sinh) đòi hỏi phải có quyền truy cập vào một lượng lớn văn bản, hình ảnh, video và dữ liệu khác. Các kỹ thuật khai thác văn bản và dữ liệu (TDM) có thể được sử dụng rộng rãi trong bối cảnh này để truy xuất và phân tích nội dung đó, bao gồm cả các nội dung có thể được bảo vệ bởi bản quyền và các quyền liên quan”. Đồng thời, luật này cũng tái khẳng định yêu cầu tôn trọng cơ chế từ chối (opt-out) theo Điều 4.3 Chỉ thị số 2019/790, tức chỉ được phép thực hiện TDM khi chủ sở hữu quyền không nêu rõ tuyên bố từ chối.
Như vậy, EU đến thời điểm hiện tại đã cung cấp một khung pháp lý tương đối chặt chẽ, giảm thiểu một cách rõ ràng các rủi ro pháp lý cho các công ty công nghệ trong quá trình phát triển các mô hình TTNT. Mặc dù vậy, đây vẫn là cách tiếp cận có điều kiện và các công ty công nghệ cần phải tuân thủ đầy đủ các yêu cầu đặt ra.
4.3. Hoa Kỳ
Tại Hoa Kỳ, pháp luật không quy định ngoại lệ cụ thể cho hoạt động huấn luyện TTNT mà chủ yếu dựa vào học thuyết sử dụng hợp lý (fair use) được quy định tại Điều 107 Đạo luật Bản quyền (17 U.S.C. § 107). Theo đó, sử dụng hợp lý phải thỏa mãn 4 yếu tố bao gồm: (i) mục đích và bản chất của việc sử dụng, bao gồm việc sử dụng đó có mang tính chất thương mại hay vì mục đích giáo dục phi lợi nhuận; (ii) bản chất của tác phẩm có bản quyền; (iii) số lượng và mức độ quan trọng của phần được sử dụng liên quan đến toàn bộ tác phẩm có bản quyền; (iv) tác động của việc sử dụng đối với thị trường tiềm năng hoặc giá trị của tác phẩm có bản quyền. Việc quyết định một hành vi có được coi là sử dụng hợp lý hay không hoàn toàn dựa trên cân nhắc của Tòa án về 4 yếu tố nêu trên. Văn phòng Bản quyền Hoa Kỳ cho rằng yếu tố thứ nhất và thứ tư có thể sẽ mang tính quyết định đáng kể trong quá trình phân tích[13], đồng thời nhận định rằng một số hình thức sử dụng tác phẩm có bản quyền để huấn luyện AI tạo sinh sẽ đủ điều kiện là sử dụng hợp lý, trong khi một số khác thì không[14]. Gần đây, vào ngày 11/02/2025, trong vụ kiện giữa Thomas Reuters v. Ross Intelligence, Tòa án quận Delaware đã bác bỏ lập luận fair use của bị đơn, đánh dấu lần đầu tiên một tòa án tại Hoa Kỳ bác bỏ biện hộ sử dụng hợp lý trong bối cảnh đào tạo AI. Theo đó, Tòa án nhận thấy rằng việc sử dụng tác phẩm của Ross Intelligence: không có tính chất chuyển đổi (transformative) – một thành tố quan trọng trong cân nhắc điều kiện (i) của hành vi sử dụng hợp lý và gây tổn hại đến thị trường tiềm năng của Thomson Reuters[15]. Tuy nhiên, cần lưu ý, sản phẩm AI trong vụ kiện này là một ứng dụng tìm kiếm pháp lý tích hợp AI, không phải một mô hình AI tạo sinh. Mặc dù vậy, quyết định này của Tòa án vẫn sẽ mở ra nhiều tranh luận pháp lý quan trọng trong tương lai.
Từ góc độ so sánh giữa 3 quốc gia, pháp luật Hoa Kỳ thể hiện sự linh hoạt cao nhất cho việc khai thác tác phẩm có bản quyền trong huấn luyện TTNT, điều này tạo ra dư địa lớn cho các công ty công nghệ phát triển. Tuy nhiên, chính sự linh hoạt này cũng khiến các doanh nghiệp phải đối mặt với mức độ rủi ro cao hơn, khi kết quả xét xử hoàn toàn phụ thuộc vào lập luận cụ thể của Toà án trong từng vụ tranh chấp.
5. Bối cảnh Việt Nam và một số gợi mở hoàn thiện pháp luật về SHTT
Trong bối cảnh Việt Nam định vị phát triển khoa học công nghệ là động lực then chốt để đưa đất nước bứt phá, phát triển trong thời kỳ mới, TTNT được xác định là một trong những công nghệ chiến lược. Cụ thể, Nghị quyết số 57/NQ-TW đề ra mục tiêu cụ thể đến năm 2030 “Việt Nam thuộc nhóm 3 nước dẫn đầu khu vực Đông Nam Á về nghiên cứu và phát triển trí tuệ nhân tạo, tối thiểu có 5 doanh nghiệp công nghệ số ngang tầm các nước tiên tiến”[16]. Trước yêu cầu đó, việc hoàn thiện pháp luật, trong đó có pháp luật SHTT, là nhiệm vụ cấp thiết để vừa thúc đẩy phát triển TTNT, vừa đảm bảo hài hòa lợi ích cho chủ sở hữu QTG. Phân tích mô hình pháp luật một số quốc gia, tác giả nhận thấy: Trung Quốc kiểm soát chặt chẽ hoạt động huấn luyện AI, Hoa Kỳ lại có cách tiếp cận mở, song dễ gây ra sự bất định về pháp lý. EU lựa chọn giải pháp cân bằng bằng cách xây dựng ngoại lệ cụ thể cho khai thác văn bản và dữ liệu. Từ đó, tác giả đưa ra đề xuất như sau: Bổ sung ngoại lệ về khai thác văn bản và dữ liệu tự động vào một trong các trường hợp ngoại lệ không xâm phạm QTG tại khoản 1 Điều 25 Luật SHTT. Cụ thể, bổ sung ngoại lệ: “Sao chép, trích xuất và lưu trữ tác phẩm trong khoảng thời gian cần thiết cho mục đích khai thác văn bản và dữ liệu tự động, trong trường hợp tác phẩm được truy cập một cách hợp pháp và không có tuyên bố cụ thể về việc bảo lưu quyền của tác giả bằng các phương thức phù hợp, bao gồm cả các phương thức do máy đọc được”.
Để đảm bảo áp dụng thống nhất quy định trên, cần làm rõ thêm một số nội dung sau:
– Định nghĩa “khai thác văn bản và dữ liệu tự động” (TDM): Tham khảo pháp luật EU, từ đó xây dựng khái niệm TDM, lưu ý làm rõ phạm vi của khái niệm này bao hàm cả các hoạt động trong quá trình đào tạo TTNT tạo sinh.
– Làm rõ khái niệm “truy cập hợp pháp”: Khoản 2 Điều 25 Luật SHTT hiện hành yêu cầu việc sử dụng tác phẩm theo ngoại lệ không được mâu thuẫn với việc khai thác bình thường và không gây thiệt hại bất hợp lý đến lợi ích hợp pháp của tác giả, chủ sở hữu QTG. Đây là điều kiện bắt buộc áp dụng cho mọi ngoại lệ, bao gồm cả ngoại lệ TDM. Tuy nhiên, để đảm bảo tính rõ ràng và khả thi trên thực tế, cần làm rõ định nghĩa “truy cập hợp pháp” và bổ sung một số ví dụ minh họa trong Nghị định số 17/2023/NĐ-CP ngày 26/4/2023 của Chính phủ quy định chi tiết một số điều và biện pháp thi hành Luật Sở hữu trí tuệ về Quyền tác giả, quyền liên quan.
– Thiết lập quy chuẩn kỹ thuật về bảo lưu quyền thông qua công nghệ máy đọc (machine-readable statement): Việc thiết lập cơ chế bảo lưu quyền bằng phương thức máy đọc là vấn đề kỹ thuật phức tạp, đòi hỏi kết hợp năng lực quản lý, công nghệ và sự tham gia của các bên liên quan. Hiện chưa có quy chuẩn kỹ thuật quốc tế, song một số phương thức phổ biến đang được sử dụng gồm: sử dụng file robots.txt để ngăn crawler thu thập dữ liệu; chèn metadata về quyền tác giả trong trang web hoặc tài liệu. Theo bản dự thảo số 3 của Quy tắc thực hành AI đa năng (General-purpose AI code of Practice) của EU[17], robots.txt là phương pháp thông dụng nhất, tuy vẫn còn một số hạn chế. Nhìn chung, Việt Nam cần từng bước xây dựng khung tiêu chuẩn kỹ thuật và pháp lý phù hợp với chuẩn mực quốc tế, có tính linh hoạt và khả thi trong lĩnh vực này. Đồng thời, cần tăng cường nhận thức cho tác giả, doanh nghiệp và các bên liên quan về tầm quan trọng của việc tuyên bố bảo lưu quyền thông qua các phương thức kỹ thuật.
6. Kết luận
Cuộc cách mạng công nghiệp lần thứ tư, với những đột phá mạnh mẽ về công nghệ, trong đó có TTNT, đang và sẽ tiếp tục tạo ra những chuyển biến sâu sắc trong đời sống xã hội, đồng thời đặt ra hàng loạt vấn đề pháp lý mới. Trước thực tiễn đó, những người làm chính sách và xây dựng pháp luật phải nhanh chóng thích ứng để kịp thời cải cách pháp luật trong nhiều lĩnh vực, trong đó có pháp luật SHTT nhằm đảm bảo tính phù hợp, hiệu quả trong bối cảnh mới. Trong khuôn khổ bài viết này, tác giả đã xem xét cách tiếp cận khác nhau của một số hệ thống pháp luật trên thế giới về giải quyết những câu hỏi còn chưa rõ ràng đối với vấn đề ngoại lệ QTG trong huấn luyện TTNT. Trên cơ sở đó, đối chiếu với bối cảnh thực tiễn tại Việt Nam, tác giả đưa ra một số định hướng hoàn thiện pháp luật SHTT, tháo gỡ những vướng mắc pháp lý đang đặt ra trong hoạt động huấn luyện mô hình AI. Những gợi mở đó giúp Việt Nam định hình những hướng đi phù hợp nhằm đẩy nhanh quá trình phát triển các lĩnh vực công nghệ lõi và bảo đảm thực thi hiệu quả các quyền SHTT. Đồng thời, bài viết cũng mở ra những hướng nghiên cứu tiếp theo, đặc biệt là những nghiên cứu mang tính liên ngành kết hợp giữa pháp luật và công nghệ. Chỉ với sự kết hợp như vậy, chúng ta mới có thể xây dựng một khuôn khổ pháp lý hiệu quả, đáp ứng kịp thời những biến chuyển nhanh chóng của công nghệ và kỹ thuật trong kỷ nguyên số.
TÀI LIỆU TRÍCH DẪN
1 Cole Stryker, Mark Scapicchio. What is generative AI?. [online] Available at https://www.ibm.com/think/topics/generative-ai
2 Alex Singla, Alexander Sukharevsky, Lareina Yee, et al. The state of AI: How organizations are rewiring to capture value. [Online] Available at https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai?utm_source=chatgpt.com
3 Xem Điều 9.1 Công ước Bern và Tuyên bố [1] Hiệp ước Quyền tác giả WIPO (WCT)
4 Cole Stryker, Mark Scapicchio. What is generative AI?. [Online] Available at: https://www.ibm.com/think/topics/generative-ai
5 US Copyright Office (2025). Copyright and Artificial Intelligence Part 3: Generative AI Training: A report of the register copyright (pre-publication version), page.29
6 Ruth L.Okediji (2017). Copyright Law in an Age of Limitations and Exceptions, Cambridge University Press, page 25
7 Hoàng Giang (2023). AI vượt qua gần 200 tác phẩm, giành giải thưởng văn học, truy cập tại https://vnexpress.net/ai-vuot-qua-gan-200-tac-pham-gianh-giai-thuong-van-hoc-4692521.html
8 US Copyright Office (2025). Copyright and Artificial Intelligence Part 3: Generative AI Training: A report of the register copyright (pre-publication version), page.59
9 Xem Điều 24 tại https://www.chinalawtranslate.com/en/Copyright-Law-of-the-PRC-(2021-Version)/
10 Xem Quy định tại https://www.chinalawtranslate.com/en/generative-ai-interim/
11 Xem tài liệu này tại https://cset.georgetown.edu/wp-content/uploads/t0588_generative_AI_safety_EN.pdf
12 Xem Chỉ thị tại https://eur-lex.europa.eu/eli/dir/2019/790/oj/eng
13 US Copyright Office (2025). Copyright and Artificial Intelligence Part 3: Generative AI Training: A report of the register copyright (pre-publication version), page.74
14 US Copyright Office (2025). Copyright and Artificial Intelligence Part 3: Generative AI Training: A report of the register copyright (pre-publication version), page.74
15 Court shuts down AI fair use argument in Thomson Reuters Enterprise Centre GMBH v. Ross Intelligence Inc. [Online] Available at https://www.reedsmith.com/en/perspectives/2025/03/court-ai-fair-use-thomson-reuters-enterprise-gmbh-ross-intelligence
16 Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia, truy cập tại
17 Xem Quy tắc tại https://digital-strategy.ec.europa.eu/en/library/third-draft-general-purpose-ai-code-practice-published-written-independent-experts
TÀI LIỆU THAM KHẢO:
Văn phòng Quốc hội (2022). Luật Sở hữu trí tuệ số 11/VBHN-VPQH
Chính phủ (2023). Nghị định số 17/2023/NĐ-CP ngày 26/4/2023 quy định chi tiết một số điều và biện pháp thi hành Luật Sở hữu trí tuệ về quyền tác giả, quyền liên quan
Bộ Chính trị (2024). Nghị quyết số57-NQ/TW ngày 22/12/2024 về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia
Standardization Administration of China (2024). Basic Safety Requirements for Generative Artificial Intelligence Services. [Online] Available at https://cset.georgetown.edu/wp-content/uploads/t0588_generative_AI_safety_EN.pdf.
Copyright Law of the PRC. [Online] Available at https://www.chinalawtranslate.com/en/Copyright-Law-of-the-PRC-(2021-Version)/
de la Durantaye, K (2025). Control and Compensation. A Comparative Analysis of Copyright Exceptions for Training Generative AI. IIC 56, 737-770
Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC. [Online] Available at https://eur-lex.europa.eu/eli/dir/2019/790/oj/eng
Dornis, T. W. and Stober, S. (2025). Generative AI Training and Copyright Law, Transactions of the International Society for Music Information Retrieval, V(N)
Interim Measures for the Management of Generative Artificial Intelligence Services. [Online] Available at https://www.chinalawtranslate.com/en/generative-ai-interim/.
Kevin Madigan (2025). First of Its Kind Decision Finds AI Training Is Not Fair Use, truy cập tại https://copyrightalliance.org/ai-training-not-fair-use/?utm_source=chatgpt.com.
Kretschmer, M., Margoni, T. & Oruç. P (2024). Copyright Law and the Lifecycle of Machine Learning Models. IIC 55, 110-138.
Lee, Katherine and Cooper, A. Feder and Grimmelmann, James, Talkin’ ‘Bout AI Generation: Copyright and the Generative-AI Supply Chain (2023). Forthcoming, Journal of the Copyright Society 2024, Available at SSRN: Available at https://ssrn.com/abstract=4523551 or http://dx.doi.org/10.2139/ssrn.4523551
Regulation (EU) 2024/1689 of the European Parliament and of the Council of 13 June 2024 laying down harmonised rules on artificial intelligence. [Online] Available at https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689.
Ruth L.Okediji (2017). Copyright Law in an Age of Limitations and Exceptions, Cambridge University Press
Singapore Copyright Act 2021. [Online] Available at https://wipolex-res.wipo.int/edocs/lexdocs/laws/en/sg/sg175en.pdf
Copyright exceptions for Generative AI training: Comparative perspectives and policy implications for Vietnam
Trinh Quoc Dat
University of Law, Vietnam National University – Hanoi
Abstract:
The Fourth Industrial Revolution, driven by technological breakthroughs, particularly generative artificial intelligence (AI), is reshaping society and raising unprecedented legal challenges. Among these, intellectual property law has become a critical area requiring timely reform to maintain coherence and effectiveness in the digital era. This study examines how different legal systems around the world address copyright exceptions for AI training and, based on comparative analysis, proposes directions for strengthening Vietnam’s legal framework. The findings provide both theoretical insights and practical recommendations, offering a useful reference for legal scholarship and legislative development in complex, technology-driven contexts.
Keywords: artificial intelligence, copyright exceptions, text and data mining.
https%3A%2F%2Ftapchicongthuong.vn%2Fngoai-le-quyen-tac-gia-doi-voi-huan-luyen-tri-tue-nhan-tao-tao-sinh-kinh-nghiem-mot-so-quoc-gia-va-goi-mo-cho-viet-nam-219760.htm