Thấy gì từ việc ảnh hưởng bản quyền sách khi ứng dụng trí tuệ nhân tạo

Vụ kiện giữa nhóm tác giả và Microsoft cho thấy, thách thức trong việc cân bằng giữa quyền sở hữu trí tuệ và phát triển trí tuệ nhân tạo.

Cân bằng giữa đổi mới công nghệ và quyền tác giả

Việc một nhóm tác giả đệ đơn kiện Microsoft vì cáo buộc sử dụng trái phép sách của họ để huấn luyện mô hình trí tuệ nhân tạo Megatron đã một lần nữa làm nổi bật lên bài toán phức tạp giữa công nghệ và bản quyền. Trong bối cảnh trí tuệ nhân tạo đang có những bước tiến lớn trong khả năng tạo sinh ngôn ngữ, hình ảnh và âm thanh, ranh giới giữa học hỏi để phát triển công nghệ và việc vi phạm quyền tác giả đang trở nên mờ nhạt.

Công nghệ trí tuệ nhân tạo phát triển mạnh tạo ra những tranh cãi về bản quyền tác giả. Ảnh minh họa: Microsoft

Theo đơn kiện nộp tại tòa án liên bang ở New York, Mỹ, các tác giả như Kai Bird, Jia Tolentino và Daniel Okrent cáo buộc Microsoft đã sử dụng gần 200.000 cuốn sách để huấn luyện mô hình ngôn ngữ của mình.

Vụ việc này diễn ra chỉ một ngày sau khi một thẩm phán liên bang ở California ra phán quyết rằng công ty Anthropic đã sử dụng hợp lý tài liệu của tác giả trong quá trình huấn luyện AI, nhưng vẫn có thể bị truy cứu nếu những tài liệu đó có nguồn gốc từ các bản sao bất hợp pháp. Đây là một trong những phán quyết đầu tiên tại Mỹ liên quan đến tính hợp pháp của việc sử dụng tài liệu có bản quyền để huấn luyện AI tạo sinh.

Vụ việc làm nổi bật mâu thuẫn ngày càng rõ rệt giữa hai bên. Các công ty công nghệ khẳng định rằng họ sử dụng dữ liệu để tạo ra nội dung mới mang tính biến đổi. Họ viện dẫn nguyên lý sử dụng hợp lý trong luật bản quyền, theo đó những trường hợp như nghiên cứu, học thuật hoặc sáng tạo có thể được phép sử dụng tài liệu mà không cần xin phép tác giả.

Tuy nhiên, khi dữ liệu được sử dụng để phát triển sản phẩm AI có giá trị thương mại cao, việc áp dụng nguyên lý này trở nên phức tạp hơn. Trong nhiều trường hợp, mô hình AI có thể sản xuất ra văn bản mang phong cách, giọng điệu và nội dung rất gần với các tác phẩm gốc, từ đó gây ra lo ngại rằng quyền lợi của tác giả đang bị xâm phạm.

Từ phía các tác giả, họ không phủ nhận sự tiến bộ mà công nghệ mang lại, nhưng nhấn mạnh rằng những nội dung do họ sáng tạo ra là kết quả của lao động trí tuệ nghiêm túc và cần được bảo vệ một cách công bằng. Khi một mô hình ngôn ngữ được huấn luyện từ hàng nghìn cuốn sách mà không có sự cho phép, điều đó không chỉ tác động đến thu nhập mà còn ảnh hưởng đến danh tiếng và quyền sở hữu tinh thần của người viết. Bên cạnh yếu tố pháp lý, đây còn là một vấn đề đạo đức khi mô hình AI được hưởng lợi từ công sức của người khác mà không có sự công nhận rõ ràng.

Trong khi đó, từ góc nhìn của các công ty phát triển AI, nếu buộc phải xin phép hoặc trả phí bản quyền cho hàng triệu đơn vị dữ liệu khác nhau, quá trình phát triển công nghệ sẽ bị chậm lại đáng kể. Điều này có thể dẫn tới việc chỉ một số ít tập đoàn lớn mới có đủ tiềm lực để tham gia cuộc đua, còn các doanh nghiệp nhỏ, các trung tâm nghiên cứu độc lập sẽ bị gạt ra bên lề. Ngoài ra, việc xác định chủ sở hữu bản quyền trong nhiều trường hợp cũng không đơn giản, đặc biệt là với các nội dung đã được chia sẻ rộng rãi trên internet từ nhiều năm trước.

Hướng tới giải pháp bền vững trong thời đại số

Những tranh cãi hiện nay cho thấy rõ một thực tế rằng khuôn khổ pháp lý hiện tại chưa bắt kịp với tốc độ phát triển của công nghệ. Các tòa án và cơ quan lập pháp của nhiều quốc gia trên thế giới sẽ cần phải đưa ra những hướng dẫn cụ thể hơn để xác định ranh giới giữa việc sử dụng hợp lý và hành vi vi phạm. Trong khi đó, xã hội nói chung cũng cần có cái nhìn công bằng và thấu đáo hơn về vai trò của cả hai phía, là người sáng tạo nội dung và người phát triển công nghệ.

Một giải pháp tiềm năng là thúc đẩy sự hợp tác giữa các tác giả, nhà xuất bản và công ty công nghệ. Các nền tảng dữ liệu dùng để huấn luyện AI nên được xây dựng theo cơ chế minh bạch, có giấy phép rõ ràng và cơ chế phân phối lợi ích hợp lý.

Việc phát triển các hệ thống truy xuất nguồn gốc dữ liệu cũng sẽ giúp đảm bảo rằng quyền lợi của người sáng tạo được ghi nhận. Đồng thời, các tác giả có thể tham gia vào quá trình thiết lập tiêu chuẩn đạo đức và pháp lý cho việc sử dụng tác phẩm của mình trong huấn luyện AI.

Một số đề xuất còn đưa ra hướng đi thông qua mô hình chia sẻ doanh thu từ sản phẩm AI sử dụng dữ liệu sáng tạo. Theo đó, các công ty công nghệ có thể đóng góp một phần lợi nhuận để hỗ trợ các tác giả, từ đó vừa đảm bảo nguồn lực cho phát triển công nghệ, vừa tôn trọng quyền sở hữu trí tuệ. Đây không chỉ là cách tiếp cận thực tế mà còn thể hiện sự tôn trọng đối với giá trị của tri thức con người trong kỷ nguyên tự động hóa.

Ở một chiều sâu hơn, xã hội cần xác định lại khái niệm sáng tạo trong thời đại trí tuệ nhân tạo. Khi máy móc có thể mô phỏng cách viết, cách kể chuyện và thậm chí cả cảm xúc văn học, điều này không làm mất đi vai trò của con người, mà ngược lại càng làm nổi bật giá trị độc đáo của tư duy, cảm xúc và trải nghiệm cá nhân. Những yếu tố đó là thứ mà công nghệ vẫn chưa thể thay thế hoàn toàn, và chính vì thế, việc bảo vệ quyền lợi cho người sáng tạo không chỉ mang tính pháp lý mà còn mang ý nghĩa nhân văn sâu sắc.

Vụ kiện giữa Microsoft và nhóm tác giả có thể là một bước ngoặt trong tiến trình xây dựng khung pháp lý cho trí tuệ nhân tạo. Nó cho thấy sự cần thiết của đối thoại, hợp tác và cập nhật luật pháp trong một thế giới đang thay đổi nhanh chóng. Thay vì đối đầu, các bên có thể cùng nhau định hình một hệ sinh thái nơi công nghệ phát triển dựa trên nền tảng của sự tôn trọng, minh bạch và công bằng.

Thách thức đặt ra hiện nay không phải là lựa chọn giữa công nghệ hay bản quyền, mà là làm thế nào để kết hợp cả hai theo cách có lợi nhất cho xã hội. Nếu đạt được sự cân bằng hợp lý, trí tuệ nhân tạo có thể trở thành công cụ mạnh mẽ để khuếch đại giá trị của tri thức nhân loại, chứ không phải thay thế hay lấn át những người đã và đang tạo ra nó. Đây không chỉ là mục tiêu của ngành công nghệ, mà còn là trách nhiệm chung của toàn xã hội trong hành trình bước vào kỷ nguyên số.

Lê An